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Verf ahren zur Herstellung von Ketocarotinoiden in Fruchten von 
Pf lanzen 

5 Beschreibung 

Die vorliegende Erfindung betrifft ein Verf ahren zur Herstellung 
von Ketocarotinoiden durch Kultivierung von genetisch veranderten 
Pflanzen, die in Fruchten eine Ketolase-Aktivitat aufweisen, die- 
10 genetisch veranderten Pflanzen, sowie deren Verwendung als 

Nahrungs- oder Futtermittel und zur Herstellung von Ketocaroti- 
noidextrakten . 

Carotinoide werden de novo in Bakterien, Algen, Pilzen und Pflan- 
15 zen synthetisiert . Ketocarotinoide , also Carotinoide, die minde- 
stens eine Keto-Gruppe enthalten, wie beispielsweise Astaxanthin, 
Canthaxan thin , Echinenon , 3 -Hydroxy echinenon , 3 ' -Hydr oxyechi - 
nenon, Adonirubin oder Adonixanthin sind natiirliche Antioxi- 
dantien und Pigmente, die von einigen Algen und Mikroorganismen 
20 als Sekundarmetabolite produziert werden. 

Aufgrund ihrer farbgebenden Eigenschaf ten werden die Ketocaroti- 
noide und insbesondere Astaxanthin als Pigmentierhilf sstof f e in 
der Tierernahrung, insbesondere in der Forell^n-, Lachs- und 
25 Shrimps zucht verwendet . 

Die Herstellung von Astaxanthin erfolgt heutzutage gro&tenteils 
durch chemische Syntheseverf ahren . Naturliche Ketocarotinoide, 
wie beispielsweise natiirliches Astaxanthin, werden heutzutage in 
30 biotechnologischen Verf ahren in kleinen Mengen durch Kultivierung 
von Algen, beispielsweise Haematococcus pluvialis, oder durch 
Fermentation von gentechnologisch optimierten Mikroorganismen 
und anschliefcender Isolierung gewonnen. 

35 Ein wirtschaf tliches biotechnologisches Verfahren zur Herstellung 
von natiirlichen Ketocarotinoiden ist daher von grofier Bedeutung. 

WO 98/18910 beschreibt die Synthese von Ketocarotinoiden in Nek- 
tarien von Tabakbluten durch Einbringen eines Ketolase-Gens 
40 in Tabak. 

WO 01/20011 beschreibt ein DNA Konstrukt zur Produktion von Keto- 
carotinoiden, insbesondere Astaxanthin, in Samen von Olsaatpflan- 
zen wie Raps, Sonnenblume, Sojabohne und Senf unter Verwendung 
45 eines Samen-spezif ischen Promotors und einer Ketolase aus Haema- 
tococcus . 
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Die im Stand der Technik of f enbarten Verfahren liefern zwar gene- 
tisch veranderte Pflanzen, die in spezifischen Geweben einen 
Gehalt an Ketocarotinoiden aufweisen, weisen jedoch den Nachteil 
auf, dass die H5he des Gehalts an Ketocarotinoiden und die Rein- 
5 heit, insbesondere an Astaxanthin, noch nicht zuf riedenstellend 



ist . 



15 



Der Erfindung lag daher die Aufgabe zugrunde, ein alternatives 
Verfahren zur Herstellung von Ketocarotinoiden durch Kultivierung 
10 von Pflanzen zur Verfugung zu stellen, bzw. weitere transgene 
Pflanzen, die Ketocarotinoide herstellen, zur Verfugung zu stel- 
len, die optimierte Eigenschaf ten, wie beispielsweise einen h6he- 
ren Gehalt an Ketocarotinoiden, aufweisen und den geschilderten 
Nachteil des Standes der Technik nicht aufweisen. 

DemgemaS wurde ein Verfahren zur Herstellung von Ketocarotinoiden 
gefunden, indem man genetisch veranderte Pflanzen kultiviert, die 
in Fruchten eine Ketolase-Aktivitat aufweisen. 

20 Unter Ketolase-Aktivitat wird die Enzymaktivitat einer Ketolase 
verstanden. s 

Unter einer Ketolase wird ein Protein verstanden, das die enzyma- 
tische Aktivitat aufweist, am, gegebenenf alls substituierten, 
25 .p-Ionon-Ring von Carotinoiden eine Keto-Gruppe einzufuhren. 

Insbesondere wird unter einer Ketolase ein Protein verstanden, 
das die enzymatische Aktivitat aufweist, p-Carotin in Cantha- 
xanthin umzuwandeln. 

Dementsprechend wird unter Ketolase-Aktivitat die in emer be- 
stimmten Zeit durch das Protein Ketolase umgesetzte Menge p-Caro- 
tin bzw. gebildete Menge Canthaxanthin verstanden. 

35 Urn in den Friichten der genetisch veranderten Pflanzen eine Keto- 
laseaktivitat aufzuweisen, werden in einer bevorzugten Aus- 
fuhrungsform genetisch veranderte Pflanzen verwendet, die in- 
Frtichten eine Ketolase exprimieren. 

40 Vorzugsweise werden daher im erf indungsgemaBen Verfahren gene- 
tisch veranderte Pflanzen verwendet, die in Fruchten mindestens 
eine Nukleinsaure , kodierend eine Ketolase, en thai ten. 



45 
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Es sind keine Pflanzen bekannt, die als Wildtyp in Fruchten exne 
Ketolase-Aktivitat aufweisen. Insbesondere weisen die nachstehend 
beschriebenen, bevorzugten Pflanzen in Fruchten als Wxldtyp kexne 
Ketolase-Aktivitat auf . 

5 in der vorliegenden Erfindung wird die Ketolase-Aktivitat in 

Fruchten der genetisch veranderten Pflanzen durch die genetxsche 
Veranderung der Ausgangspf lanze verursacht. Die erfindungs- 
gemafie genetisch veranderte Pf lanze weist somit, xm Verglexch 

10 zur genetisch nicht veranderten Ausgangspf lanze eine Ketolase- 
Aktivitat in Fruchten auf und ist somit vorzugswea.se xn der Lage, 
in Fruchten eine Ketolase zu exprimieren. 

Unter dera Begriff "Ausgangspf lanze - oder "Wildtyp" wird die ent- 
15 sprechende nicht genetisch veranderte Ausgangspf lanze verstanden. 

Unter dem Begriff "genetisch veranderte Pflanze* wird vorzugs- 
weise eine im Vergleich zur Ausgangspf lanze genetisch veranderte 
Pf lanze verstanden. 

20 ere nach Zusammenhang kann unter dem Begriff «Pflanze» die Aus- 
gangspf lanze (Wildtyp) oder eine erf indungsgemaSe , genetxsdh ver- 
anderte Pf lanze oder beides verstanden warden. 

25 Die Verursachung der Genexpression einer Nukleinsaure, kodierend 
eine Ketolase, in den Fruchten der Pflanzen erfolgt vorzugswexse 
durch Einbringen von Nukleinsauren, die Ketolasen kodxeren, xn 
die Ausgangspf lanze. 

30 Die Erfindung betrifft daher insbesondere das vorstehend be- 

schriebene Verfahren, dadurch gekennzeichnet , dass man genetxsch 
veranderte Pflanzen verwendet, in die man ausgehend 
Ausgangspf lanze, mindestens eine Nukleinsaure, kodierend exne 
Ketolase, eingebracht hat. 

35 Dazu kann prinzipiell jedes Ketolase-Gen, also jede Nukleinsaure 
die eine Ketolase kodiert, verwendet werden. 

Alle in der Beschreibung erwahnten Nukleinsauren konnen 
40 beispielsweise eine RNA-, DNA- oder cDNA-Sequenz sexn. . 

Bei genomischen Ketolase-Seguenzen aus eukaryontischen Quellan. 
die introns enthalten, sind fur den Fall, dass dxe Wxrtspf lanze 
nicht in der Lage ist oder nicht in die Lage versetzt werden 
45 kann die entsprechenden Ketolase zu exprimieren, bevorzugt oe- 
prozessierte Nukleinsaureseguenzen, wie die entsprechenden 
cDNAs, zu verwenden. 
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Beispiele fur Nukleinsauren, kodierend eine Ketolase, und die 
entsprechenden Ketolasen, die im' erf indungsgema£en Verfahren bzw. 
in den nachstehend beschriebenen erf indungsgemafeen genetisch ver- 
Snderten Pflanzen verwendet werden yzormen, sind beispielsweise 
5 Sequenzen aus 

Haematoccus pluvialis, insbesondere aus Haematoccus pluvialis 
Flotow em, Wille (Accession No. X86782; Nukleinsaure: 
SEQ ID No . 1 , Protein SEQ ID No. 2 ) , 

10 

Haematoccus pluvialis, NIES-144 (Accession No- D45881; Nuklein- 
saure: SEQ ID No. 3, Protein SEQ ID No. 4), 

Agrobacterium aurantiacum (Accession No. D58420; Nukleinsaure: 
15 SEQ. ID. No. 5, Protein SEQ ID No. 6), 

Alicaligenes spec. (Accession No. D58422; Nukleinsaure: 
SEQ ID No. 7, Protein SEQ ID No. 8), 

20 Paracoccus marcusii (Accession No. Y15112; Nukleinsaure: 
SEQ ID No. 9, Protein SEQ ID No. 10). 

s 

Synechocystis sp. Strain PC6803 (Accession No. S76617, NP442491; 
Nukleinsaure: SEQ ID No. 11 # Protein SEQ ID No. 12). 

25 

Bradyrhizobium sp. (Accession No. AF218415, BAB 74888; Nuklein- 
saure: SEQ ID No. 13, Protein SEQ ID No. 14). 

Nostoc sp. Strain PCC7120 (Accession No. AP003592; Nukleinsaure: 
30 SEQ ID No. 15, Protein SEQ ID No. 16). 

Haematococcus pluvialis (Accession NO: AF534876, AAN03484; Nuk- 
leinsaure: SEQ ID NO: 37, Protein: SEQ ID NO: 38) 

35 Paracoccus sp. MBIC1143 (Accession NO: D58420, P54972; Nuk- 
leinsaure: SEQ ID NO: 39, Protein: SEQ ID NO: 40) 

Brevundimonas aurantiaca (Accession NO: AY166610, AAN86030; Nuk- 
leinsaure: SEQ ID NO: 41, Protein: SEQ ID NO: 42) 

40 

Nodularia spumigena NSOR10 (Accession NO: AY210783 , AA064399; Nu- 
kleinsaure: SEQ ID NO: 43, Protein: SEQ ID NO: 44) 

Nostoc punctiforme ATCC 29133 (Accession NO: NZ_AABC01000195 , 
45 ZP_00111258; Nukleinsaure: SEQ ID NO: 45, Protein: SEQ ID NO: 46) 



PF 53863 



5 

Nostoc punctiforme ATCC 29133 (Accession NO: NZ_AABC01000196 ; Nu- 
kleinsaure: SEQ ID NO: 47, Protein: SEQ ID NO: 48) 

Deinococcus radiodurans Rl (Accession NO: E75561, AE001872; Nu- 
5 kleinsaure: SEQ ID NO: 49, Protein: SEQ ID NO: 50) 

Weitere natlirliche Beispiele fxir Ketolasen und Ketolase-Gene , die 
im erf indungsgemaSen Verfahren verwendet werden konnen, lassen 
sich beispielsweise aus verschiedenen Organismen, deren genomi- 
10 sche Sequenz bekannt ist, durch Identitatsvergleiche der Amino- 
sauresequenzen oder der entsprechenden riickubersetzten Nuklein- 
sauresequenzen aus Datenbanken mit den vorstehend beschriebenen 
Sequenzen und insbesondere mit den Sequenzen SEQ ID NO. 2 und/ 
oder SEQ ID NO. 16 leicht auffinden. 

15 

Weitere nattirliche Beispiele fur Ketolasen und Ketolase-Gene las- 
sen sich weiterhin ausgehend von den vorstehend beschriebenen 
Nukleinsauresequenzen, insbesondere ausgehend von den Sequenzen 
SEQ ID. No 1 und/ oder SEQ ID NO. 15 aus verschiedenen Organismen, 
20 deren genomische Sequenz nicht bekannt ist, durch Hybridisie- 

rungstechniken in an sich bekannter Weise leicht auffinden. 

s 

Die Hybridisierung kann unter moderaten (geringe Stringenz) 
oder vorzugsweise unter stringenten (hohe Stringenz) Bedingungen 
25 erfolgen. 

Solche Hybridisierungsbedingungen sind beispielsweise bei Sam- 
brook, J., Fritsch, E.F., Maniatis , T. , in: Molecular Cloning 
(A Laboratory Manual) , 2. Auflage, Cold Spring Harbor Laboratory 
30 Press, 1989, Seiten 9.31-9.57 oder in Current Protocols in Mole- 
cular Biology, John Wiley & Sons, N . Y. (1989), 6.3.1-6.3.6 be- 
schrieben. 

Beispielhaft konnen die Bedingungen wahrend des Waschschrittes 
35 ausgew&hlt sein aus dem Bereich von Bedingungen begrenzt von sol- 
chen mit geringer Stringenz (mit 2X SSC bei 50°C) und solchen mit 
hoher Stringenz (mit 0.2X SSC bei 50°C, bevorzugt bei 65°C) 
(20X SSC: 0,3 M Natriumcitrat , 3 M Natriumchlorid, pH 7.0). 

40 Daruberhinaus kann die Temperatur wahrend des Waschschrittes von 
moderaten Bedingungen bei Raumtemperatur , 22°C, bis zu stringenten 
Bedingungen bei 65 °C angehoben werden. 

Beide Parameter, Salzkonzentration und Temperatur, kdnnen gleich- 
45 zeitig variiert werden, auch kann einer der beiden Parameter kon- 
stant gehalten und nur der andere variiert werden. Wahrend der 
Hybridisierung konnen auch denaturierende Agenzien wie zum Bei- 
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spiel Formamid oder SDS eingesetzt werden. In Gegenwart von 50 % 
Formamid wird die Hybridisierung bevorzugt bei 42 °C ausgefuhrt. 

Einige beispielhaf te Bedingungen fur Hybridisierung und Wasch- 
5 schritt sind infolge gegeben: 

(1) Hybridisierungsbedingungen mit zuia Beispiel 

(i) 4X SSC bei 65°C, oder 

(ii) 6X SSC bei 45°C, oder 



10 



15 



(iii) 6X SSC bei 68°C, 100 mg/ml denaturierter Fischsperma- 
DNA, oder 

(iv) 6X SSC, 0,5 % SDS, 100 mg/ml denaturierte , fragmen- 
tierte Lachssperma-DNA bei 68°C, oder 



(v) 6XSSC, 0,5 % SDS, 100 mg/ml denaturierte, f ragmentierte 
20 Lachssperma-DNA, 50 % Formamid bei 42 °C, oder 

(vi) 50 % Formamid, 4X SSC bei 42 °C, oder ' 

(vii) 50 % (vol/vol) Formamid, 0,1 % Ririderserumalbumin, 

25 0,1 % Ficoll, 0,1 % Polyvinylpyrrolidon, 50 mM Natrium- 

phosphatpuf fer pH 6,5, 750 mM NaCl, 75 mM Natriumcitrat 
bei 42°C, oder 



30 



(viii) 2X oder 4X SSC bei 50°C (moderate Bedingungen), oder 

(ix) 30 bis 40 % Formamid, 2X oder 4X SSC bei 42° (moderate 
Bedingungen) . 



(2) Waschschritte fur jeweils 10 Minuten mit zum Beispiel 

35 

(i) 0,015 M NaCl/0,0015 M Natriumcitrat /0, 1 % SDS bei 50°C, 
oder 

(ii) 0,1X SSC bei 65°C, oder 

40 

(iii) 0,1X SSC, 0.5 % SDS bei 68°C, oder 

(iv) 0,1X SSC, 0.5 % SDS, 50 % Formamid bei 42 °C, oder 
45 (v) 0,2X SSC, 0.1 % SDS bei 42°C, oder 
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(vi) 2X SSC bei 65°C (moderate Bedingungen) . 

In einer bevorzugten Aus ftihrungs form der erf indungsgema&en Ver- 
fahrens bringt man Nukleinsauren ein, die ein Protein kodieren, 
5 enthaltend die Aminosauresequenz SEQ ID NO. 2 oder eine von die- 
ser Sequenz durch Substitution, Insertion oder Deletion von Ami- 
nosSuren abgeleitete Sequenz, die eine Identit&t von mindestens 
20 %, vorzugsweise mindestens 30 %, bevorzugter mindestens 40 %, 
bevorzugter mindestens 50 %, bevorzugter mindestens 60 %, bevor- 
10 zugter mindestens 70 %, bevorzugter mindestens 80 %, besonders 
bevorzugt mindestens 90 % auf Aminos aureebene mit der Sequenz SEQ 
ID NO. 2 und die enzymatische Eigenschaft einer Ketolase auf- 
weist . 

15 Dabei kann es sich um eine naturliche Ketolase-Sequenz handeln, 
die wie vorstehend beschrieben durch Identitatsvergleich der 
Sequenzen aus anderen Organismen gefunden werden kann oder um 
eine ktostliche Ketolase-Sequenz die ausgehend von der Sequenz 
SEQ ID NO, 2 durch kunstliche Variation, beispielsweise durch 

20 Substitution, Insertion oder Deletion von Aminos&uren abgewandelt 
wurde „ 

y 

In einer weiteren bevorzugten Aus fuhrungs form der erf indungs- 
gemaSen Verfahren bringt man man NukleinseLureii ein, die ein Pro- 

25 tein kodieren, enthaltend die Aminosauresequenz SEQ ID NO. 16 
oder eine von dieser Sequenz durch Substitution, Insertion oder 
Deletion von Aminosauren abgeleitete Sequenz, die eine Identitat 
von mindestens 20 %, vorzugsweise mindestens 30 %, bevorzugter 
mindestens 40 %, bevorzugter mindestens 50 %, bevorzugter minde- 

3 0 stens 60 %, bevorzugter mindestens 70 %, bevorzugter mindestens 
80 %, besonders bevorzugt mindestens 90 % auf Aminos aureebene mit 
der Sequenz SEQ ID NO. 16 und die enzymatische Eigenschaft einer 
Ketolase aufweist. 

35 Dabei kann es sich um eine nattirliche Ketolase-Sequenz handeln, 
die wie vorstehend beschrieben durch Identitatsvergleich der 
Sequenz en aus anderen Organismen gefunden werden kann oder um 
eine kunstliche Ketolase-Sequenz die ausgehend von der Sequenz 
SEQ ID NO. 16 durch kunstliche Variation, beispielsweise durch 

40 Substitution, Insertion oder Deletion von Aminosauren abgewandelt 
wurde . 

Unter dem Begriff "Substitution" ist in der Beschreibung der Aus- 
tausch einer oder mehrerer Aminosauren durch eine oder mehrere 
45 Aminosauren zu verstehen. Bevorzugt werden sog. konservative Aus- 
tausche durchgefuhrt , bei denen die ersetzte Aminosaure eine ahn- 
liche Eigenschaft hat wie die ursprtingliche Aminosaure, 
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beispielsweise Austausch von Glu durch Asp, Gin durch Asn, Val 
durch lie, Leu durch He, Ser durch Thr. 

Deletion 1st das Ersetzen einer Aminosaure durch eine direkte 
5 Bindung. Bevorzugte Positionen fur Deletionen sind die Termini 
des Polypeptides und die Verkniipfungen zwischen den einzelnen 
Proteindomanen . 

insertionen sind Einfiigungen von Aminosauren in die Polypeptid- 
10 kette, wobei formal eine direkte Bindung durch ein oder mehrere 
Aminosauren ersetzt wird. 

Unter Identitat zwischen zwei Proteinen wird die Identitat der 
Aminosauren uber die jeweils gesamte Proteinlange verstanden, 
15 insbesondere die Identitat die durch Vergleich mit Hxlfe der 
Lasergene Software der Firma DNASTAR, inc. Madison, Wisconsin 
(USA) unter Anwendung der Clustal Methode (Higgins DG, Sharp PM. 
Fast and sensitive multiple sequence alignments on a microcompu- 
ter. Comput Appl. Biosci. 1989 Apr ; 5 (2 ): 151-1) unter Exnstellung 
20 folgender Parameter berechnet wird: 



Multiple alignment 


parameter : 




Gap penalty 




10 


25 Gap length penalty 




10 


Pairwise alignment 


parameter : 




K— tuple 




1 


Gap penalty 




3 


Window 




5 


30 Diagonals saved 




5 



Unter einem Protein, das eine Identitat von mindestens 20 % 
auf Aminosaureebene mit der Sequenz SEQ ID NO. 2 oder 16 auf- 
weist, wird dementsprechend ein Protein verstanden, das bex exnem 
35 Vergleich seiner Sequenz mit der Sequenz SEQ ID NO. 2 oder 16, 
insbesondere nach obigen Programmalgorithmus mit obigem Parame 
tersatz eine Identitat von mindestens 20 % aufweist. 

Geeignete Nukleinsauresequenzen sind beispielsweise durch Riick- 
40 ubersetzung der Polypeptidsequenz gemaS dem genetischen Code er- 
haltlich. 

Bevorzugt werden dafar solche Kodons verwendet, die entsprechend 
der pflanzespezifischen codon usage haufig verwendet werden. Die 
45 codon usage lasst sich anhand von Computerauswertungen anderer, 
bekannter Gene der betreffenden Organismen leicht ermitteln. 
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In einer besonders bevorzugten Ausfuhrungsf orm bringt man eine 
Nukleinsaure, enthaltend die Sequenz SEQ ID NO. 1, in den Pflanze 
ein. 

5 In einer weiteren besonders bevorzugten Ausfuhrungsf orm bringt 
man eine Nukleinsaure, enthaltend die Sequenz SEQ ID NO. 15, in 
den Pflanze ein. 

Alle vorstehend erwahnten Ketolase-Gene sind weiterhin in an sich 
10 bekannter Weise durch chemische Synthese aus den Nukleotidbau- 
steinen wie beispielsweise durch Fragmentkondensation einzelner 
iiberlappender , komplementarer Nukleinsaurebausteine der Doppel- 
helix herstellbar. Die chemische Synthese von Oligonukleotiden 
kann beispielsweise, in bekannter Weise, nach der Phosphoamidit- 
15 methode (Voet, Voet, 2. Auflage, Wiley Press New York, Seite 

896-897) erfolgen. Die Anlagerung synthetischer Oligonukleotide 
und Aufftillen von Lticken mithilfe des Kl enow-Fragment es der DNA- 
Polymerase und Ligations re aktionen sowie allgemeine Klonierungs- 
verfahren werden in Sambrook et al . (1989), Molecular cloning: 
20 A laboratory manual, Cold Spring Harbor Laboratory Press, 
beschrieben. 

r 

In einer besonderes bevorzugten Ausfuhrungsf orm der erfindungs- 
gemaSen Verfahrens verwendet man genetisch veranderte Pflanzen, 
25 die in Frtichten die hdchste Expressionsrate einer Ketolase auf- 
weisen. 

Vorzugsweise wird dies dadurch erreicht, dass die Genexpression 
der Ketolase unter Kontrolle eines f ruchtspezif ischen Promotors 
30 erfolgt. Beispielsweise werden dazu die vorstehend beschriebenen 
Nukleinsauren, wie nachstehend ausfuhrlich beschrieben, in einem 
Nukleinsaurekonstrukt, funktionell verknxipft mit einem f rucht- 
spezif ischen Promotor, in die Pflanze eingebracht. 

35 Unter Pflanzen werden erf indungsgema& vorzugsweise Pflanzen 

verstanden, die als Wildtyp in Frtichten Chromoplasten aufweisen. 

Weiter bevorzugte Pflanzen weisen als Wildtyp in den Frtichten zu- 
satzlich Carotinoide, insbesondere ^-Carotin, Zeaxanthin, Neo- 
40 xanthin, Violaxanthin oder Lutein auf . 

Weiter bevorzugte Pflanzen weisen als Wildtyp in den Frtichten zu~ 
satzlich eine Hydroxylase-Aktivitat auf . 

45 Onter Hydroxylase-Aktivitat wird die Enzymaktivitat einer Hydro- 
xylase verstanden. 
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Unter einer Hydroxylase wird ein Protein verstanden, das die 
enzymatische Aktivit&t aufweist, am, gegebenenf alls substituier- 
ten, P-Ionon-Ring von Carotinoiden eine Hydroxy-Gruppe einzu- 
f iihren . 

5 

Insbesondere wird unter einer Hydroxylase ein Protein verstanden, 
das die enzymatische Aktivitat aufweist, P-Carotin in Zeaxanthin 
oder Canthaxanthin in Astaxanthin umzuwandeln, 

10 Dementsprechend wird unter Hydroxylase-Aktivitat die in einer 
bestimmten Zeit durch das Protein Hydroxylase umgesetzte Menge 
p-Carotin oder Canthaxanthin bzw. gebildete Menge Zeaxanthin oder 
Astaxanthin verstanden. 

15 In einer bevorzugten Ausfiihrungsf orm werden Pflanzen kultiviert, 
die gegenuber dem Wildtyp zusatzlich eine erhohte Hydroxylase-Ak- 
tivitat und/oder P-Cyclase-Aktivit&t aufweisen. 

Unter Hydroxylase-Aktivitat wird die Enzymaktivitat einer Hydro- 
20 xylase verstanden. 

Unter einer Hydroxylase wird ein Protein verstanden, das die en- 
zymatische Aktivitat aufweist, am, gegebenenf alls substituierten, 
P-Ionon-Ring von Carotinoiden eine Hydroxy-Gruppe einzuftihren. 

25 

Insbesondere wird unter einer Hydroxylase ein Protein verstanden, 
das die enzymatische Aktivitat aufweist, P-Carotin in Zeaxanthin 
oder Cantaxanthin in Astaxanthin umzuwandeln. 

30 Dementsprechend wird unter Hydroxyase-Aktivitat die in einer be- 
stimmten Zeit durch das Protein Hydroxylase umgesetzte Menge P-Ca- 
rotin oder Cantaxanthin bzw. gebildete Menge Zeaxanthin oder 
Astaxanthin verstanden. 

35 Bei einer erhohten Hydroxylase-Aktivitat gegenuber dem Wildtyp 
wird somit im Vergleich zum Wildtyp in einer bestimmten Zeit 
durch das Protein Hydroxylase die umgesetzte Menge P-Carotin oder 
Cantaxantin bzw. die gebildete Menge Zeaxanthin oder Astaxanthin 
erhdht . 

40 

Vorzugsweise betragt diese Erhohung der Hydroxylase-Aktivitat 
mindestens 5 %, weiter bevorzugt mindestens 20 %, weiter bevor- 
zugt mindestens 50 %, weiter bevorzugt mindestens 100 %, bevor- 
zugt er mindestens 300 %, noch bevorzugt er mindestens 500 %, ins- 
45 besondere mindestens 600 % der Hydroxylase-Aktivitat des Wild- 
typs. 
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Unter (3-Cyclase-Aktiviteit wird die Enzymaktivitat einer (3-Cyclase 
verstanden. 

Unter einer p-Cyclase wird ein Protein verstanden, das die enzyma- 
5 tische Aktivitat aufweist, einen endstSndigen, linearen Rest von 
Lycopin in einen (3-Ionon-Ring zu uberfiihren. 

Insbesondere wird unter einer (J-Cyclase ein Protein verstanden, 
das die enzymatische Aktivitat aufweist, y-Carotin in (i-Carotin 
10 umzuwandeln. 

Dementsprechend wird unter fi-Cyclase-Aktivitat die in einer be- 
stimmten Zeit durch das Protein (3-Cyclase umgesetzte Menge y-Caro- 
tin bzw, gebildete Menge {5~Carotin verstanden. 

15 

Bei einer erhdhten (3-Cyclase -Aktivitat gegeniiber dem Wildtyp wird 
somit im Vergleich zum Wildtyp in einer bestimmten Zeit durch 
das Protein |3-Cyclase die umgesetzte Menge y-Carotin bzw. die ge- 
bildete Menge (3-Carotin erh6ht. 

20 

Vorzugsweise betr&gt diese Erhohung der {3-Cyclase-Aktivitat minde- 
stens 5 %, weiter bevorzugt mindestens 20 %, weiter bevorzlSgt 
mindestens 50 %, weiter bevorzugt mindestens 100 %, bevorzugter 
mindestens 300 %, noch bevorzugter mindestens * 500 %, insbesondere 
25 mindestens 600 % der ji-Cyclase-Aktivitat des Wildtyps. 

Unter dem Begriff "Wildtyp' 7 wird erf indungsgemafi die entspre- 
chende nicht genet isch veranderte Ausgangspf lanze verstanden. 

3 0 Vorzugsweise und insbesondere in Fallen, in denen die Pf lanze 

oder der Wildtyp nicht eindeutig zugeordnet werden kann, wird un- 
ter "Wildtyp" fur die Erhdhung der Hydroxylase-Aktivitat, fur die 
Erhohung der p-Cyclase-Aktivitat und ftir die Erhohung des Gehalts 
an Ketocarotinoiden jeweils eine Referenzpf lanze verstanden, 

35 

Diese Referenzpf lanze ist vorzugsweise Lycopersicon esculent urn. 

Die Bestimmung der Hydroxylase-Aktivitat in erf indungsgemaSen ge- 
netisch veranderten Pflanzen und in Wildtyp- bzw. Ref erenzpf lan- 
40 zen erfolgt vorzugsweise unter folgenden Bedingungen: 

Die Aktivitat der Hydroxylase wird nach Bouvier et al . (Biochim. 
Biophys. Acta 1391 (1998), 320-328) in vitro bestimmt. Es wird zu 
einer bestimmten Menge an Pf lanzenextrakt Ferredoxin, Ferredoxin- 
45 NADP Oxidoreductase, Katalase, NADPH sowie beta-Carotin mit Mono- 
und Digalaktosylglyzeriden zugegeben. 
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Besonders bevorzugt erfolgt die Bestimmung der Hydroxylase-Akti- 
vitat unter folgenden Bedingungen nach Bouvier, Keller, d'Harlin- 
gue und Camara (Xanthophyll biosynthesis: molecular and functio- 
nal characterization of carotenoid hydroxylases from pepper 
5 fruits (Capsicum annuum L . ; Biochim. Biophys . Acta 1391 (1998), 
320-328) : 

Der in-vitro Assay wird in einem Volumen von 0.250 ml Volumen 
durchgefuhrt . Der Ansatz enthalt 50 mM Kaliumphosphat (pH 7.6), 

10 0.025 mg Ferredoxin von Spinat, 0.5 Einheiten Ferredoxin-NADP+ 
Oxidoreduktase von Spinat, 0.25 mM NADPH, 0.010 mg. beta-Carotin 
(in 0.1 mg Tween 80 emulgiert) , 0.05 mM einer Mischung von Mono- 
und Digalaktosylglyzeriden (1:1) , 1 Einheit Katalyse, 200 Mono- 
und Digalaktosylglyzeriden, (1:1), 0.2 mg Rinderserumalbumin und 

15 Pf lanzenextrakt in unter schiedlichem Volumen. Die Reaktionsmi- 
schung wird 2 Stunden bei 30C inkubiert. Die Reaktionsprodukte 
werden mit organischem. Losungsmittel wie Aceton oder Chloroform/ 
Methanol (2:1) extrahiert und mittels HPLC bestimmt. 

20 Die Bestimmung der p-Cyclase-AktivitSt in erf indungsgemaSen gene- 
tisch veranderten Pflanzen und in Wildtyp- bzw. Ref erenzpf lanzen 
erfolgt vorzugsweise unter folgenden Bedingungen: ' 

Die Aktivitat der p-Cyclase wird nach Fraser tind Sandmann (Bio- 
25 chem. Biophys. Res. Comm. 185(1) (1992) 9-15) in vitro bestimmt. 
Es werden zu einer bestimmten Menge an Pf lanzenextrakt Kalium- 
phosphat als Puffer (ph 7.6), Lycopin als Substrat, Stromaprotein 
von Paprika, NADP+, NADPH und ATP zugegeben. 

30 Besonders bevorzugt erfolgt die Bestimmung der Hydroxylase -Akti- 
vitat unter folgenden Bedingungen nach Bouvier, d'Harlingue und 
Camara (Molecular Analysis of carotenoid cyclae inhibition; Arch. 
Biochem. Biophys. 346(1) (1997) 53-64): 

3 5 Der in- vitro Assay wird in einem Volumen von 250 °ci Volumen 
durchgefiihrt. Der Ansatz enthalt 50 mM Kaliumphosphat 
(pH 7 . 6) ,unterschiedliche Mengen an Pf lanzenextrakt , 20 nM Lyco- 
pin, 250 <*=g an chromoplastidarem Stromaprotein aus Paprika, 0.2 
mM NADP+, 0.2 mM NADPH und 1 mM ATP. NADP /NADPH und ATP werden in 

40 10 ml Ethanol mit 1 mg Tween 80 unmittelbar vor der Zugabe zum 

Inkubationsmedium gelost. Nach einer Reaktionszeit von 60 Minuten 
bei 30C wird die Reaktion durch Zugabe von Chloroform/Me thanol 
(2:1) beendet. Die in Chloroform extrahierten Reaktionsprodukte 
werden mittels HPLC analysiert. 

45 
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Ein alternativer Assay mit radioaktivem Substrat ist beschrieben 
in Fraser und Sandmann (Biochem. Biophys . Res, Comm. 185(1) 
(1992) 9-15). 

5 Die Erhohung der Hydroxylase-Aktivitat und/oder P-Cyclase-Aktivi- 
tat kann durch verschiedene Wege erfolgen, beispielsweise durch 
Ausschalten von hemmenden Regulationsmechanismen auf Expressions- 
und Proteinebene oder durch Erhohung der Genexpression von Nu- 
* kleinscluren kodierend eine Hydroxylase und/oder von Nukleinsauren 
10 kodierend eine P-Cyclase gegentiber dem Wildtyp. 

Die Erhdhung der Genexpression der Nukleins&uren kodierend eine 
Hydroxylase und/oder die Erhohung der Genexpression der Nuklein- 
s&ure kodierend eine p-Cyclase gegenuber dem Wildtyp kann eben- 

15 falls durch verschiedene Wege erfolgen, beispielsweise durch In- 
duzierung des Hydroxylase-Gens und/oder p-Cyclase-Gens durch Akti- 
vatoren oder durch Einbringen von einer oder mehrerer Hydroxy- 
lase-Genkopien und/oder P~Cyclase-Genkopien, also durch Einbringen 
mindestens einer NukleinsM.ure kodierend eine Hydroxylase und/oder 

20 mindestens einer Nukleins&ure kodierend eine £-Cyclase in die 
Pf lanze . 

s 

Unter Erhdhung der Genexpression einer Nukleinsaure codierend 
eine Hydroxylase und/oder P-Cyclase wird erf iridungsgemafi auch die 
25 Manipulation der Expression der Pflanzen eigenen, endogenen Hy- 
droxylase und/oder p-Cyclase verstanden. 

Dies kann beispielsweise durch Veranderung der Promotor DNA-Se- 
quenz fur Hydr oxy 1 a s en und/oder P-Cyclasen kodierende Gene er- 
30 reicht werden. Eine solche Veranderung, die eine erhohte Expres- 
sionsrate des Gens zur Folge hat, kann beispielsweise durch Dele- 
tion oder Insertion von DNA Sequenzen erfolgen, 

Es ist, wie vorstehend beschrieben, moglich, die Expression der 
35 endogenen Hydroxylase und/oder ^-Cyclase durch die Applikation ex- 
ogener Stimuli zu verandern. Dies kann durch besondere physiolo- 
gische Bedingungen, also durch die Applikation von Fremdsubstan- 
zen erfolgen. 

40 Des weiteren kann eine veranderte bzw. erhohte Expression eines 
endogenen Hydroxylase- und/oder p-Cyclase-Gens dadurch erzielt 
werden, dass ein in der nicht trans formiert en Pflanze nicht vor- 
koiranendes Regulator-Protein mit dem Promotor dieses Gens in Wech- 
selwirkung tritt. 
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Solch ein Regulator kann ein chimares Protein darstellen, welches 
aus einer DNA-BindedomSne und einer Transkriptionsaktivator-Do- 
mane besteht, wie beispielsweise in WO 96/06166 beschrieben. 

5 In einer bevorzugten Aus ftthrungs form erfolgt die Erhohung der Ge- 
nexpression einer Nukleinsaure kodierend eine Hydroxylase und/ 
oder die Erhohung der Genexpression einer Nukleinsaure kodierend 
eine {3-Cyclase durch Einbringen von mindestens einer Nukleinsaure 
kodierend eine Hydroxylase und/ oder durch Einbringen von minde- 
10 stens einer Nukleinsaure kodierend eine (J-Cyclase in die Pflanze. 

Dazu kann prinzipiell jedes Hydroxylase-Gen bzw. jedes ^-Cyclase- 
Gen, also jede Nukleinsaure, die eine Hydroxylase und jede Nu- 
kleinsaure, die eine ^-Cyclase codiert, verwendet werden. 

15 

Bei genomischen Hydroxylase-bzw. P-Cyclase-Nukleinsaure-Sequenzen 
aus eukaryontischen Quellen, die Introns enthalten, sind fur den 
Fall das die Wirtspflanze nicht in der Lage ist oder nicht in die 
Lage versetzt werden kann, die entsprechende Hydroxylase bzw. 
20 p~Cyclase zu exprimieren, bevorzugt bereits prozessierte Nuklein- 
sauresequenzen, wie die entsprechenden cDNAs zu verwenden. 

s 

Beispiele fur Hydroxylase -Gene sind Nukleinsauren, 

25 kodierend eine Hydroxylase aus Haematococcus pluvialis, Accession 
AX038729, WO 0061764); (Nukleinsaure: SEQ ID NO: 51, Protein: 
SEQ ID NO: 52) , 

sowie Hydroxylasegene der folgenden Accession Nummera: 

30 

|emb|CAB55626.1, CAA70427.1, CAA70888.1, CAB55625.1, AF499108_1, 
AF315289_1, AF296158_1, AAC49443.1, NP_194300.1, NP_200070 . 1, 
AAG10430.1, CAC06712.1, AAM88619.1, CAC95130.1, AAL80006.1, 
AF162276_1, AA053295.1, AAN85601.1, CRTZ_JBRWHE, CRTZ_PANAN, 
35 BAB79605.1, CRTZ_ALCSP, CRTZ_AGRAU, CAB56060.1, ZP_0009483 6 . 1 , 
AAC44852.1, BAC77670.1, NP.J745389 . 1 , NP_344225.1, NP_849490.1, 
ZP_00087019.1, NP_503072.1, NP_852012.1, NP_115929.1, 
ZP_00013255.1 

40 Eine besonders bevorzugte Hydroxylase ist weiterhin die Hydroxy- 
lase aus Tomate) (Nukleinsaure: SEQ. ID. No. 55; Protein: SEQ. 
ID. No. 56) 



45 
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Beispiele ftir b-Cyclase-Gene sind Nukleinseiuren, codierend eine 
b-Cyclase aus Tomate (Accession X86452) . (Nukleinsaure : SEQ ID NO 
53, Protein: SEQ ID NO: 54), sowie b-Cyclase-Gene der folgenden 
Accession Nummern: 



25 



S663 50 lycopene beta-cyclase (EC 5.5.1.-) - tomato 
CAA60119 lycopene synthase [Capsicum annuum] 

lycopene beta-cyclase (EC 5.5.1.-) - common tobacco 
lycopene cyclase [Nicotiana tabacum] 
10 AAM21152 lycopene beta-cyclase [Citrus sinensis] 
lycopene cyclase [Citrus x paradisi] 
lycopene cyclase [Citrus unshiu] 
lycopene beta-cyclase [Citrus sinensis] 
lycopene beta-cyclase [Adonis palaestina] 
15 AAG10429 beta cyclase [Tagetes erecta] 
lycopene cyclase 
Lycopene beta cyclase 

beta-lycopene cyclase [Sandersonia aurantiaca] 
lycopene cyclase [Narcissus pseudonarcissus] 
20 AAM45381 beta cyclase [Tagetes erecta] 

lycopene beta-cyclase [Zea mays] 
chromoplast-specif ic lycopene beta-cyclase 
[Lycopersicon esculentum] 
lycopene beta-cyclase [Daucus carota] 
hypothetical protein [Prochlorococcus marinus str. 
MIT9313] 

hypothetical protein [Prochlorococcus marinus subsp. 
pastoris str. CCMP1378] 

hypothetical protein [Prochlorococcus marinus subsp. 
pastoris str. CCMP1378] 

hypothetical protein [Prochlorococcus marinus str. 
MIT9313) 

hypothetical protein [Synechococcus sp. WH 8102] 
lycopene cyclase [Deinococcus radiodurans] 
35 BAA29250 393aa long hypothetical protein [Pyrococcus 
horikoshii] 

lycopene beta-monocyclase [marine bacterium P99-3] 
lycopene cyclase [Xanthobacter sp. Py2] 
hypothetical protein [Chlorof lexus aurantiacus] 
4 0 ZP_000941 hypothetical protein [Novosphingobium 
ar omat ic ivorans ] 

lycopene cyclase [Bradyrhizobium sp. ORS278] 
crtY [Pantoea agglomerans pv. milletiae] 
lycopene cyclase [Streptomyces griseus] 
45 AAA21262 dycopene cyclase [Pantoea agglomerans] 
crtY protein - Erwinia uredovora 
crtY [Pantoea agglomerans pv. milletiae] 



30 



S66349 

CAA57386 

AAM21152 

AAD38049 

AAN86060 

AAF447 00 

AAK07430 

AAG10429 

AAA81880 

AAB53337 

AAL92175 

CAA67331 

AAM45381 

AA018661 

AAG21133 

AAF18989 
ZP_001140 

ZP_001050 

ZP_001046 

ZP_001134 

ZP_001150 

AAF10377 

BAA29250 

BAC77673 
AAL01999 
ZP_0Q019O 
ZP_000941 

AAF78200 

BAB79602 

CAA64855 

AAA21262 

C37802 

BAB79602 
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AAA64980 
AAC44851 
BAA09593 
ZP_000941 

5 

CAB56061 
BAA20275 
ZP_000570 
ZP_000190 
10 AAK07430 
CAA67331 
AAB53337 
BAC77673 
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lycopene cyclase [Pantoea agglomerans] 
lycopene cyclase 

Lycopene cyclase [Paracoccus sp. MBIC1143] 
hypothetical protein [Novosphingobium 
aromaticivorans ] 

lycopene beta-cyclase [Paracoccus marcusii] 
lycopene cyclase [Erythrobacter longus] 
hypothetical protein [Thermobif ida fusca] 
hypothetical prcptein [Chlorof lexus aurantiacus] 
lycopene beta-cyclase [Adonis palaestina] 
lycopene cyclase [Narcissus pseudonarcissus] 
Lycopene beta cyclase 

lycopene beta-monocyclase [marine bacterium P99-3] 



15 Eine besonders bevorzugte ^-Cyclase ist weiterhin die chromopla- 
stenspezif ische b-Cyclase aus Tomate (AAG21133) (Nukleins&ure : 
SEQ . ID. No, 57; Protein: SEQ. ID. No. 58) 

In den erf indungsgem&fien bevorzugten transgenen Pflanzen liegt 
20 also in dieser bevorzugten Aus fiihrungs form gegentiber dem Wildtyp 
mindestens ein wei teres Hydroxylase-Gen und/oder (5-Cyclase-Gen 
vor . 

In dieser bevorzugten Aus fiihrungs form weist die genetisch veran- 
25 derte Pflanze beispielsweise mindestens eine exogene Nuklein- 
saure, kodierend eine Hydroxylase oder mindestens zwei endogene 
NukleinsSuren, kodierend eine Hydroxylase und/oder mindestens 
eine exogene NukleinsMure, kodierend eine (3-Cyclase oder minde- 
stens zwei endogene Nukleinsauren, kodierend eine (3-Cyclase auf . 

30 

Bevorzugt verwendet man in vorstehend beschriebener bevorzugter 
Ausftihrungsform als Hydroxylase-Gene Nukleinsauren, die Proteine 
kodieren, enthaltend die Aminos&uresequenz SEQ ID NO: 52 oder 
eine von dieser Sequenz durch Substitution, Insertion oder Dele- 

3 5 tion von Aminosauren abgeleitete Sequenz, die eine Identit&t 
von mindestens 30 %, vorzugsweise mindestens 50 %, bevorzugter 
mindestens 7 0%, noch bevorzugter mindestens 90 %, am bevorzugte- 
sten mindestens 95 % auf Aminosaureebene mit der Sequenz SEQ. ID. 
NO: 52, und die die enzymatische Eigenschaft einer Hydroxylase 

40 aufweisen. 



Weitere Beispiele fiir Hydroxylasen und Hydroxylase-Gene las- 
sen sich beispielsweise aus verschiedenen Organismen, deren geno- 
mische Sequenz bekannt ist, wie vorstehend beschrieben, durch Ho- 
45 mologievergleiche der Aminosauresequenzen oder der entsprechenden 
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rtickubersetzten Nukleinsauresequenzen aus Datenbanken mit der SeQ 
ID. NO: 52 leicht auffinden. 

Weitere Beispiele fur Hydroxylasen und Hydroxylase-Gene las sen 
5 sich weiterhin beispielsweise ausgehend von der Sequenz 

SEQ ID NO: 51 aus verschiedenen Organismen deren genomische Se- 
quenz nicht bekannt ist, wie vorstehend beschrieben, durch Hybri- 
disierungs- und PCR-Techniken in an sich bekannter Weise leicht 
auffinden. 

10 

In einer weiter besonders bevorzugten Aus fuhrungs form werden zur 
Erhohung der Hydroxylase-Aktivit&t Nukleinsauren in Organismen 
eingebracht, die Proteine kodieren, enthaltend die Aminosaurese- 
quenz der Hydroxylase der Sequenz SEQ ID NO: 52. 

15 

Geeignete Nukleinsauresequenzen sind beispielsweise durch Rtick- 
vibersetzung der Polypeptidsequenz gema£ dem genet ischen Code er- 
haltlich. 

20 Bevorzugt werden dafur solche Codons verwendet, die entsprechend 
der pflanzenspezif ischen codon usage haufig verwendet werden. Die 
codon usage lasst sich anhand von Computerauswertungen anderer, 
bekannter Gene der betreffenden Organismen leicht ermitteln. 

25 In einer besonders bevorzugten Ausf uhrungsf orm bringt man eine 

Nukleinsaure, enthaltend die Sequenz SEQ . ID. NO: 51 in den Orga- 
nismus ein. 

Bevorzugt verwendet man in vorstehend beschriebener bevorzugter 
30 Ausfiihrungsf orm als (5-Cyclase-Gene Nukleinsauren, die Proteine ko 
dieren, enthaltend die Amino saure sequenz SEQ ID NO: 54 oder eine 
von dieser Sequenz durch Substitution, Insertion oder Deletion 
von Amino s&ur en abgeleitete Sequenz, die eine Identitat von min- 
destens 30 %, vorzugsweise mindestens 50 %, bevorzugter minde- 
35 stens 70 %, noch bevorzugter mindestens 90 %, am bevorzugtesten 
mindestens 95 % auf AminosSureebene mit der Sequenz SEQ ID 
NO: 54, und die die enzymatische Eigenschaft einer p-Cyclase auf- 
weisen. 

40 Weitere Beispiele fur (3-Cyclasen und P-Cyclase-Gene lassen sich 
beispielsweise aus verschiedenen Organismen, deren genomische Se- 
quenz bekannt ist, wie vorstehend beschrieben durch Homologiever- 
gleiche der Aminosauresequenzen oder der entsprechenden ruckiiber- 
setzten Nukleinsauresequenzen aus Datenbanken mit der SEQ ID NO: 

45 54 leicht auffinden. 
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Weitere Beispiele filx P-Cyclasen und p-Cyclase-Gene lassen sich 
weiterhin beispielsweise ausgehend von der Sequenz SEQ ID NO: 53 
aus verschiedenen Organismen deren genomische Sequenz nicht be- 
kannt ist, durch Hybridisierungs- und PCR-Techniken in an sich 
5 bekannter Weise leicht auffinden. 

In einer weiter besonders bevorzugten Aus fiihrungs form werden zur 
Erhohung der |3-Cyclase-Aktivit&t Nukleins&uren in Organismen ein- 
gebracht, die Proteine kodieren, enthaltend die Aminosauresequenz 
10 der p-Cyclase der Sequenz SEQ . ID, NO: 54, 

Geeignete Nukleinsauresequenzen sind beispielsweise durch Riick- 
libersetzung der Polypeptidsequenz gem^S dem genetischen Code er- 
haltlich. 

15 

Bevorzugt werden daftir solche Codons verwendet, die entsprechend 
der pf lanzenspezif ischen codon usage haufig verwendet werden. Die 
codon usage lasst sich anhand von Computerauswertungen anderer, 
bekannter Gene der betreffenden Organismen leicht ermitteln. 

20 

In einer besonders bevorzugten Aus fuhrungs form bringt man eine 
Nukleinsaure, enthaltend die Sequenz SEQ. ID. NO: 53 in den Orga- 
nismus ein. 

25 Alle vorstehend erw&hnten Hydroxylase-Gene oder J3-Cyclase-Gene 
sind weiterhin in an sich bekannter Weise durch chemische Syn- 
these aus den Nukleotidbausteinen wie beispielsweise durch Frag- 
mentkondensation einzelner tiberlappender , komplementarer Nuklein- 
saurebausteine der Doppelhelix herstellbar. Die chemische Syn- 

30 these von Oligonukleotiden kann beispielsweise, in bekannter 

Weise, nach der Phosphoamiditmethode (Voet, Voet, 2. Auflage, Wi- 
ley Press New York, Seite 896-897) erfolgen. Die Anlagerung syn- 
thetischer Oligonukleotide und Auffullen von Liicken mithilfe des 
Kl enow-Fr agmentes der DNA-Polymerase und Ligationsreaktionen so- 

35 wie allgemeine Klonierungsverf ahren werden in Sambrook et al. 

(1989), Molecular cloning: A laboratory manual, Cold Spring Har- 
bor Laboratory Press, beschrieben. 

Besonders bevorzugte Pflanzen sind Pflanzen, ausgewahlt aus den 
40 Pf lanzengattungen Actinophloeus , Aglaeonema, Ananas, Arbutus, 
Archontophoenix, Area, Aronia, Asparagus, Attalea, Berberis, 
Bixia, Brachychilum, Bryonia, Caliptocalix, Capsicum, Carica, 
Celastrus, Citrullus, Citrus, Convallaria, Cotoneaster, 
Crataegus, Cucumis, Cucurbita, Cuscuta, Cycas, Cyphomandra, 
45 Dioscorea, Diospyrus, Dura, Elaeagnus, Elaeis, Erythroxylon, 
Euonymus, Ficus, Fortunella, Fragaria, Gardinia, Gonocaryum, 
Gossypium, Guava, Guilielma, Hibiscus, Hippophaea, Iris, Lathy- 
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rus, Lonicera, Luff a, Lycium, Lycopersicum, Malpighia, Mangifera, 
Mormodica, Murraya, Musa, Nenga, Palisota, Pandanus , Passiflora, 
Persea, Physalis, Prunus, Ptychandra, Punica, Pyracantha, Pyrus, 
Ribes, Rosa, Rubus, Sabal, Sambucus, Seaforita, Shepherdia, Sola- 
5 num, Sorbus, Synaspadix, Tabernae, Tamus, Taxus, Trichosanthes, 
Triphasia, Vaccinium, Viburnum, Vignia oder Vitis . 

Die Bestimmung der Ketolase-Aktivitat in erf indungsgemSSen gene- 
tisch veranderten Pf lanzen erfolgt in Anlehnung an die Methode 

10 von Frazer et al., (J. Biol. Chem. 272(10): 6128-6135, 1997). Die 
Ketolase-Aktivitat in pflanzlichen Extrakten wird mit den Sub- 
straten beta-Carotin und Canthaxanthin in Gegenwart von Lipid 
(Sojalecithin) und Detergens (Natriumcholat ) bestimmt. Substrat/ 
Produkt-Verhaltnisse aus den Ketolase-Assays werden mittels HPLC 

15 ermittelt. 

Im erf indungsgemaSen Verfahren zur Herstellung von Ketocarotinoi- 
den wird vorzugsweise dem Kultivierungsschritt der genetisch ver- 
anderten Pf lanzen, im folgenden auch transgene Pf lanzen bezeich- 
20 net, ein Ernten der Pf lanzen und ein Isolieren von Ketocarotinoi- 
den aus den Fruchten der Pf lanzen angeschlossen. 

s 

Die transgenen Pf lanzen werden in an sich bekannter Weise auf 
Nahrboden gezogen und entsprechend geerntet. 

25 

Die Isolierung von Ketocarotinoiden aus den geernteten Frtichten 
erfolgt in an sich bekannter Weise, beispielsweise durch Trock- 
nung und anschlieSender Extraktion und gegebenenf alls weiterer 
chemischer oder physikali sober Reinigungsprozesse, wie beispiels- 

30 weise Fallungsmethoden, Kristallographie, thermische Trennver- 
fahren, wie Rektifizier verfahren oder physikalische Trennver- 
fahren, wie beispielsweise Chromatographie . Die Isolierung von 
Ketocarotinoiden aus den Frtichten erfolgt beispielsweise bevor- 
zugt durch organische Losungsmittel wie Aceton, Hexan, Ether oder 

3 5 tert . -Me thylbutyl ether . 

Weitere Isolierverf ahren von Ketocarotinoiden sind beispielsweise 
in Egger und Kleinig (Phytochemistry (1967) 6, 437-440) und Egger 
(Phytochemistry (1965) 4, 609-618) beschrieben. 

40 

Vorzugsweise sind die Ketocarotinoide ausgewahlt aus der Gruppe 
As taxanthin , Canthaxanthin , Echinenon , 3 -Hydr oxyechinenon , 
3 ' -Hydroxyechinenon, Adonirubin und Adonixanthin . 

45 Ein besonders bevorzugtes Ketocarotinoid ist As taxanthin. 
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Die Herstellung der transgenen Pflanzen erf olgt . vorzugsweise 
durch Transformation der Ausgangspf lanzen, mit einem Nuklein- 
sMurekonstrukt , das mindestens eine, vorzugsweise auch mehrere 
der vorstehend beschriebenen Nukleinsauren enthalt, die mit einem . 
5 oder mehreren Regulationssignalen funktionell verkniipft sind, die 
die Transkription und Translation in Pflanzen gewahrleisten. 

Diese Nukleinsaurekonstrukte , in denen die kodierende Nuklein- 
sauresequenz mit einem oder mehreren Regulationssignalen funktio- 
10 nell verkniipft sind, die die Transkription und Translation in 
Pflanzen gewahrleisten, werden im folgenden auch Expressions- 
kassetten genannt. 

Vorzugsweise enthalten die Regulationssignale einen oder mehrere 
15 Promotoren, die die Transkription und Translation in Pflanzen ge- 
wahrleisten . 

Die Express ionskassett en beinhalten Regulationssignale, also 
regulative Nukleins&uresequenzen, welche die Expression der 

20 kodierenden Sequenz in der Wirtszelle steuern. Gem&S einer bevor- 
zugten Ausfuhrungsf orm umfasst eine Expressionskassette stromauf- 
wSrts , d.h. am 5'~Ende der kodierenden Sequenz, einen Promotor 
und stromabwarts, d.h. am 3'-Ende, ein Polyadenylierungs signal 
und gegebenenf alls weitere regulatorische Elemente, welche mit 

25 der dazwischenliegenden kodierenden Sequenz fur mindestens eines 
der vorstehend beschriebenen Gene pperativ verkmipft sind. Unter 
einer operativen Verkmipfung versteht man die sequenzielle Anord- 
nung von Promotor, kodierender Sequenz, Terminator und ggf . wei- 
terer regulativer Elemente derart, dass jedes der regulativen 

30 Elemente seine Funktion bei der Expression der kodierenden 
Sequenz bestiromungsgemaS erfiillen kann. 

Im folgenden werden beispielhaft die bevorzugten Nukleinsaurekon- 
strukte, Expressionskassetten und Vektoren ftir Pflanzen und Ver- 
35 fahren zur Herstellung von transgenen Pflanzen, sowie die trans- 
genen Pflanzen selbst beschrieben. 

Die zur operativen Verknttpfung bevorzugten aber nicht darauf 
beschrankten Sequenzen sind Targeting-Sequenzen zur Gewahrlei- 

40 stung der subzellularen Lokalisation im Apoplasten, in der Vaku- 
ole, in Plastiden, im Mitochondrium, im Endoplasmatischen Retiku- 
lum (ER) , im Zellkern, in Olkorperchen oder anderen Kompartimen- 
ten und Translationsverstarker wie die 5 ' -Fiihrungs sequenz aus dem 
Tabak-Mosaik-Virus (Gallie et al . , Nucl . Acids Res. 15 (1987), 

45 8693-8711) . 
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Als Promotoren der Expressionskassette ist grundsatzlich jeder 
Promoter geeignet, der die Expression von Fremdgenen in Pflanzen 
steuern kann. 

5 "Konstitutiver" Promotor meint solche Promotoren, die eine 

Expression in zahlreichen, bevorzugt alien, Geweben iiber einen 
groiSeren Zeitraum der Pf lanzenentwicklung, bevorzugt zu alien 
Zeitpunkten der Pf lanzenentwicklung, gewahrleisten. 

10 Vorzugsweise verwendet man insbesondere einen pflanzlichen 

Promotor oder einen Promotor, der einem Pf lanzenvirus entstammt. 
Insbesondere bevorzugt ist der Promotor des 35S-Transkriptes des 
CaMV Blumenkohlmosaikvirus (Franck et al . (1980) Cell 21:285-294; 
Odell et al. (1985) Nature 313:810-812; Shewmaker et al . (1985) 

15 Virology 140:281-288; Gardner et al . (1986) Plant Mol Biol 

6:221-228) oder der 19S CaMV Promotor (US 5,352,605; WO 84/02913; 
Benfey et al . (1989) EMBO J 8:2195-2202). 

Ein weiterer geeigneter konstitutiver Promotor ist der pds Promo- 

20 ter (Pecker et al . (1992) Proc. Natl. Acad. Sci USA 89: 

4962-4966) oder der "Rubisco small subunit (SSU) "-Promotor 
(US 4,962,028), der LeguminB-Promotor (GenBank Acc.-Nr. X05677) , 
der Promotor der Nopal insynthase aus Agrobacterium, der TR-Dop- 
pelpromotor, der OCS (Octopin Synthase) Promotor aus Agrobacter- 

25 ium, der Ubiquitin Promotor (Holtorf S et al. (1995) Plant Mol 
Biol 29:637-649), den Ubicjuitin 1 Promotor (Christensen et al . 
(1992) Plant Mol Biol 18:675-689; Bruce et al . (1989) Proc Natl 
Acad Sci USA 86:9692-9696), den Smas Promotor, den Cinnamylalko- 
holdehydrogenase-Promotor (US 5,683,439), die Promotoren der va- 

30 kuolarer ATPase Untereinheiten oder der Promotor eines prolinrei- 
chen Proteins aus Weizen (WO 91/13 991) , der Pnit-Promoter 
(Y07648.L, Hillebrand et al. (1998), Plant. Mol. Biol. 36, 89-99, 
Hillebrand et al. (1996), Gene, 170, 197-200, der Ferredoxin- 
NADPH-Oxidoreductase Promotor (Datenbankeintrag AB011474, Posi- 

35 tion 70127 bis 69493), der TPT-Promoter (WO 03006660), der „Su- 
perpromotor" (US-Patent 5955646), der 34S-Promotor (US-Patent 
6051753) sowie weitere Promotoren von Genen, deren konstitutive 
Expression in Pflanzen dem Fachmann bekannt ist. 

40 Die Expressionskassetten konnen auch einen chemisch induzierbaren 
Promotor enthalten (Ubersichtsartikel : Gatz et al . (1997) Annu 
Rev Plant Physiol Plant Mol Biol 48:89-108), durch den die Ex- 
pression des Ketolase-Gens in der Pflanze zu einem bestimmten 
Zeitpunkt gesteuert werden kann. Derartige Promotoren, wie z.B. 

45 der PRP1 Promotor (Ward et al . (1993) Plant Mol Biol 22:361-366), 
durch Salicylsaure induzierbarer Promotor (WO 95/19443), ein 
durch Benzolsulf onamid-induzierbarer Promotor (EP 0 388 186), 
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ein durch Tetrazyklin-induzierbarer Promotor (Gatz et al. (1992) 
Plant J 2:397-404), ein durch Abscisinsaure induzierbarer 
Promotor (EP 0 335 528) bzw. ein dur.ch Ethanol- oder Cyclohexa- 
non-induzierbarer Promotor (WO 93/21334) kSnnen ebenfalls 
5 verwendet werden. 

Ferner sind Promotoren bevorzugt, die durch biotischen oder abio- 
tischen Stress induziert werden wie beispielsweise der pathogen- 
induzierbare Promotor des PRPl-Gens (Ward et al. (1993) Plant Mol 
10 Biol 22:361-366), der hitzeinduzierbare hsp70- oder hsp80-Promo- 
ter aus Tomate (US 5,187,267), der k&lteinduzierbare alpha-Amy- 
lase Promoter aus der Kartof-fel (WO 96/12814) , der licht-indu- 
zierbare PPDK Promotor oder der verwundungsinduzierte pinll-Pro- 
moter (EP375091) . 

15 

Pathogen- induzierbare Promotoren umfassen die von Genen, die 
infolge eines Pathogenbe falls induziert werden wie beispiels- 
weise Gene von PR-Proteinen, SAR-Proteinen, b-1, 3-Glucanase, 
Chitinase usw. (beispielsweise Redolfi et al . (1983) Neth J 

20 Plant Pathol 89:245-254; Uknes, et al. (1992) The Plant 

Cell4: 645-656; Van Loon (1985) Plant Mol Viral 4:111-116; Mari- 
neau et al . (1987) Plant Mol Biol 9:335-342; Matton et al.'(1987) 
Molecular Plant-Microbe Interactions 2:325-342? Somssich et al. 
(1986) Proc Natl Acad Sci USA 83:2427-2430; Somssich et al. 

25 (1988) Mol Gen Genetics 2:93-98; Chen et al. (1996) Plant J 
10:955-966; Zhang and Sing (1994) Proc Natl Acad Sci USA 
91:2507-2511; Warner, et al . (1993) Plant J 3:191-201; Siebertz 
et al. (1989) Plant Cell 1:961-968(1989). 

30 Umfasst sind auch verwundungs- induzierbare Promotoren wie der 
des pinll Gens (Ryan (1990) Ann Rev Phytopath 28:425-449; Duan 
et al. (1996) Nat Biotech 14:494-498), des wunl und wun2-Gens 
(US 5,428,148), des winl- und win2-Gens (Stanford et al . (1989) 
Mol Gen Genet 215:200-208), des Systemin (McGurl et al. (1992) 

35 Science 225:1570-1573), des WIPl-Gens (Rohmeier et al . (1993) 
Plant Mol Biol 22:783-792; Ekelkamp et al. (1993) FEBS Letters 
323:73-76), des MPI-Gens (Corderok et al . (1994) The Plant J 
6 (2) :141-150) und dergleichen. 

40 Weitere geeignete Promotoren sind beispielsweise f ruchtreif ung- 
spezifische Promotoren, wie beispielsweise der f ruchtreif ung-spe- 
zifische Promotor aus Tomate (WO 94/21794, EP 409 625) . Entwick- 
lungsabhangige Promotoren schlie£en zum Teil die gewebespezi- 
fischen Promotoren ein, da die Ausbildung einzelner Gewebe natur- 

45 gemafi entwicklungsabhangig erfolgt. 
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Weiterhin sind insbesondere solche Promotoren bevorzugt, die die 
Expression in Geweben oder Pf lanzenteilen sicherstellen, in denen 
beispielsweise die Biosynthese von Ketocarotinoiden bzw. dessen 
Vorstufen stattf indet . Bevorzugt sind beispielsweise Promotoren 
5 mit Spezifitaten fur die Antheren, Ovarien, Petalen, Sepalen, 
Bluten, Blatter, Stengel, Wurzeln und Fruchte und Kombinationen 
hieraus . 

Knollen-, Speicherwurzel- oder Wurzel-spezif ische Promotoren 
10 sind beispielsweise der Patatin Promotor Klasse I (B33) oder 
der Promotor des Cathepsin D Inhibitors aus Kartof f el . 

Blattspezif ische Promotoren sind beispielsweise der Promotor 
der cytosolischen FBPase aus Kartof fel (WO 97/05900), der SSU 
15 Promotor (small subunit) der Rubisco (Ribulose-1, 5-bisphosphat- 
carboxylase) oder der ST-LSI Promotor aus Kartof fel (Stockhaus 
et al. (1989) EMBO J 8:2445-2451). 

Blutenspezif ische Promotoren sind beispielsweise der Phytoen Syn- 
20 thase Promotor (WO 92/16635) oder der Promotor des P-rr Gens (WO 
98/22593) . 

s 

Antheren-spezif ische Promotoren sind beispielsweise der 5126- 
Promotor (US 5,689,049, US 5,689,051), der glob-l Promotor oder 
25 der g-Zein Promotor. 

Fruchtspezif ische Promotoren sind beispielsweise 

der Pds-Promoter aus Tomate (Genbank-ACCESSION U46919; Corona, 
30 V., Aracri, B. , Kosturkova, G., Bartley, G. E. , Pitto, L.,Gior- 
getti, L . , Scolnik, P. A. and Giuliano, G,, Regulation of a caro- 
tenoid biosynthesis gene promoter during plant development 
Plant OT. 9 (4), 505-512 (1996)), SEQ ID NO.17, 

35 der 2A11 Promoter aus Tomate (Pear, J.R., Ridge, N. , Rasmussen, 
R. , Rose, R.E. and Houck, CM. Isolation and characterization 
of a fruit-specific cDNA and the corresponding genomic clone 
from tomatoPlant Mol. Biol. 13 (6), 639-651 (1989), SEQ ID NO. 
18, 

40 

der Cucumisin Promoter (Yamagata, H., Yonesu, K. , Hirata, A. 
and Aizono, Y. , TGTCACA Motif Is a Novel cis-Regulatory Enhancer 
Element Involved in Fruit-specific Expression of the cucumisin 
GeneJ. Biol. Chem. 277 (13), 11582-11590 (2002), SEQ ID NO. 19, 

45 
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der Promoter des Endogalacturonasegens (Redondo-Nevado, J. , Me- 
dina-Escobar, N., Cabal lero-Repullo, J.L. and Munoz -Blanco, J. 

A fruit-specific and development ally regulated endo-polygalactu- 
5 ronase gene from strawberry (Fragaria x ananassa c.v. Chandler), 
J Experimental Botany 52 (362) 1941-1945 (2001), SEQ ID NO. 20, 

der Polygalacturonase Promoter aus Tomate (Nicholass, F.J., 
Smith, C.J., Schuch, W. , Bird, C.R. and Grierson, D. , High levels 
10 of ripening-specific reporter gene expression directed by tomato 
fruit polygalacturonase gene-flanking regions, Plant Mol . Biol. 
28 (3), 423-435 (1995)), SEQ ID NO. 21, 

die TMF7 und TMF9 Promotoren (US 5608150), 

15 

der Promotor E4 (Cordes S. Deikman J. Margossian LJ. Fischer RL. 
Interaction of a developmentally regulated DNA-binding factor 
with sites flanking two different fruit-ripening genes from to- 
mato (1989), Plant Cell 1, 1025-1034) und 

20 

der Promotor E8 (Deikman and Fisher, Interaction of a DNA binding 
factor with the 5 '-flanking region of an ethyl ene-responsive 
fruit ripening gene from tomato (1988), EMBO J. 7, 3315-3320). 
Weitere zur Expression in Pflanzen geeignete Promotoren sind be- 
25 schrieben (Rogers et al. (1987) Meth in Enzymol 153:253-277; 
Schardl et al. (1987) Gene 61:1-11; Berger et al. (1989) Proc 
Natl Acad Sci USA 86:8402-8406) 

Alle in der vorliegenden Anmeldung beschriebenen Promotoren er- 
30 moglichen in der Regel die Expression der Ketolase in Friichten 
der erf indungsgemaSen Pflanzen. 

Besonders bevorzugt im erf indungsgemaSen Verfahren sind konstitu- 
tive sowie insbesondere f ruchtspezif ische Promotoren. 

35 

Die vorliegende Erfindung betrifft daher insbesondere ein 
Nukleinsaurekonstrukt , enthaltend funktionell verknupft einen 
fruchtspezif ischen Promotor, besonders bevorzugt einen oben 
beschriebenen fruchtspezif ischen Promotor, und eine Nukleinsaure, 
40 kodierend eine Ketolase. 

Die Herstellung einer Expressionskassette erfolgt vorzugsweise 
durch Fusion eines geeigneten Promotors mit einer vorstehend 
beschriebenen Nukleinsaure kodierend eine Ketolase und vorzugs- 
45 weise einer zwischen Promotor und Nukleinsaure-Sequenz inserier- 
ten Nukleinsaure, die fiir ein plastidenspezif isches Transitpeptid 
kodiert, sowie einem Polyadenylierungssignal nach gangigen 
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Rekombinations- und Klonierungstechniken, wie sie beispielsweise 
in T. Maniatis, E.F. Fritsch und J. Sambrook, Molecular Cloning: 
A Laboratory Manual, Cold Spring Harbor Laboratory, Cold Spring 
Harbor, NY (1989) sowie in T.J. Silhavy, M.L. Berman und L.W. En- 
5 quist, Experiments with Gene Fusions, Cold Spring Harbor Labora- 
tory, Cold Spring Harbor, NY (1984) und in Ausubel, F.M. et al . , 
Current Protocols in Molecular Biology, Greene Publishing Assoc. 
and Wiley-Interscience (1987) beschrieben sind. 

10 Die vorzugsweise insertierte Nukleins&uren, kodierend ein plasti- 
dares Trans itpept id, gewahrleisten die Lokalisation in Plastiden 
und insbesondere in Chromoplasten. 

Es kdnnen auch Express ionskasset ten verwendet werden, deren 
15 Nukleinsaure-Sequenz fur ein Ketolase-Fusionsprotein kodiert, 
wobei ein Teil des Fusionsproteins ein Transitpeptid ist, das 
die Translokation des Polypeptides steuert. Bevorzugt sind fur 
die Chromoplasten spezifische Transitpeptide, welche nach Trans- 
lokation der Ketolase in die Chromoplasten vom Ketolase-Teil 
20 enzymatisch abgespalten werden. 

Insbesondere bevorzugt ist das Transitpeptid, das von der plasti- 
daren Nxcotiana tabacum Transketolase oder einem anderen Transit- 
peptid (z.B. dem Transitpeptid der kleinen Untereinheit der 
25 Rubisco (rbcS) oder der Ferredoxin NADP Oxidoreduktase als auch 
der Isopentenylpyrophosphat Isomerase-2) oder dessen funktionel- 
lem Equivalent abgeleitet ist. 

Besonders bevorzugt sind Nukleinsaure-Sequenzen von drei 
30 Kassetten des Plastiden-Transitpeptids der plastidaren Trans- 
ketolase aus Tabak in drei Leserastern als KpnI/BamHI Fragmente 
mit einem ATG-Kodon in der Ncol Schnittstelle : 

pTP09 

35 

KpnI_GGTACCATGGCGTCTTCTTCTTCTCTCACTCTCTCTCAAGCTATCCTCTCTCGTTCTGTC 
CCTCGCCATGGCTCTGCCTCTTCTTCTCAACTTTCCCCTTCTTCTCTCACTTTTO 
ATCCi^ATCCCAATATCACCACCTCCCGCCGCCGTACTCCTTCCTCCGCCGCCGCCGCCGCCGTCG 
TAAGGTCACCGGCGATTCGTGCCTCAGCTGCAACCGAAACCATAGAGAAAACTGAGACTGCGGGA 
40 TCCJBamHI 

pTPlO 

KpnI_GGTACCATGGCGTCTTCTTCTTCTCTCACTCTCTCTCAAGCTATCCTCTCTCGTTCTGTC 
4 5 CCTCGCCATGGCTCTGCCTCTTCTTCTCAACTTTC 

ATCCAATCCCAATATCACCACCTCCCGCCGCCGTACTCCTTCCTCCGCCGCCGCCGCCGCCGTCG 
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TAAGGTCACCGGCGATTCGTGCCTCAGCTGCAACCGAAACCATAGAGAAAACTGAGACTGCGCTG 
GATCC_BainHI 

pTPll 

5 

KpnI_GGTACCATGGCGTCTTCTTCTTCTCTCACTCTCTCTCAAGCTATCCTCTCTCGTTCTGTC 
CCTCGCCATGGCTCTGCCTCTTCTTCTCAACTTTCCCCTTCTTCTCTCACTTTTTCCGGCCTTAA 
ATCCAATCCCAATATCACCACCTCCCGCCGCCGTACTCCTTCCTCCGCCGCCGCCGCCGCCGTCG 
TAAGGTCACCGGCGATTCGTGCCTCAGCTGCAACCGAAACCATAGAGAAAACTGAGACTGCGGGG 
10 ATCCJBamHI 

Weitere Beispiele fur ein plastidares Transitpeptid sind das 
Trans itpept id der plastid&ren Isopentenyl-pyrophosphat Isome- 
rase-2 (IPP-2) aus Arabisopsis thaliana und das Transitpeptid der 
15 kleinen Untereinheit der Ribulosebisphospaht Carboxylase (rbcS) 
aus Erbse (Guerineau, F, Woolston, S, Brooks, L, Mullineaux, P 
(1988) An expression cassette for targeting foreign proteins into 
the chloroplstas . Nucl . Acids Res. 16: 11380). 

20 Die erf indungsgemaEen Nukleinsauren konnen synthetisch herge- 
stellt oder nattirlich gewonnen sein oder eine Mischung aus syn- 
thetischen und nattirlichen Nukleinsaure-Bestandteilen enthalten, 
sowie aus verschiedenen beterologen Genabschnitten verschiedener 
Organ ismen bestehen. 

25 

Bevorzugt sind, wie vorstehend beschrieben, synthetische Nukleo- 
tid-Sequenzen mit Kodons, die von Pflanzen bevorzugt werden. 
Diese von Pflanzen bevorzugten Kodons konnen aus Kodons mit der 
hochsten ProteinhSuf igkeit bestimmt werden, die in den meisten 
30 interessanten Pf lanzenspezies exprimiert werden. 

Bei der Preparation einer Expressionskassette k6nnen verschiedene 
DNA-Fragmente manipuliert werden, urn eine Nukleotid-Sequenz zu 
erhalten, die zweckmafiigerweise in der korrekten Richtung liest 
35 und die mit einem korrekten Leseraster ausgestattet ist. Fur die 
Verbindung der DNA-Fragmente miteinander konnen an die Fragmente 
Adaptoren oder Linker angesetzt werden. 

ZweckmaEigerweise konnen die Promotorr und die Terminator-Regio- 
40 nen in Transkriptionsrichtung mit einem Linker oder Polylinker, 
der eine oder mehrere Restriktionsstellen fur die Insertion die- 
ser Seguenz enthalt, versehen werden. In der Regel hat der Linker 
1 bis 10, meistens 1 bis 8, vorzugsweise 2 bis 6 Restriktions- 
stellen. Im allgemeinen hat der Linker innerhalb der regulatori- 
45 schen Bereiche eine GroSe von weniger als 100 bp, haufig weniger 
als 60 bp, mindestens jedoch 5 bp. Der Promotor kann sowohl nativ 
bzw. homolog als auch fremdartig bzw. heterolog zur Wirtspflanze 
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sein. Die Expressionskassette beinhaltet vorzugsweise in der 
5'-3'-Transkriptionsrichtung den Promotor, eine kodierende 
NukleinsSuresequenz oder ein NukleinsSurekonstrukt und eine 
Region fiir die transkriptionale Termination. Verschiedene Ter- 
5 minationsbereiche sind gegeneinander beliebig austauschbar. 

Ein Beispiel fur einen Terminator ist der 35S~Terminator 
(Guerineau et al. (1988) Nucl Acids Res. 16: 11380), der nos Ter- 
minator (Depicker A, Stachel S, Dhaese P, Zambryski P, Goodman 

10 HM. Nopaline synthase: transcript mapping and DNA sequence. 
J Mol Appl Genet. 1982 ; 1 { 6 ): 561-73 ) oder der ocs Terminator 
(Gielen, J, de Beuckeleer, M, Seurinck, J, Debroek, H, de Greve, 
H, Leiraners, M, van Montagu, M, Schell, J (1984) The complete 
sequence of the TL— DNA of the Agrobacterium tumefaciens plasmid 

15 pTiAch5. EMBO J. 3: 835-846). 

Ferner konnen Manipulationen, die passende Restriktionsschnitt- 
stellen bereitstellen oder die iiberflussige DNA oder Restrikti- 
onsschnittstellen entfernen, eingesetzt werden. Wo Insertionen, 
20 Deletionen oder Subs ti tut ionen wie z.B. Transitionen und Trans- 
versionen in Frage kommen, konnen in vitro-Mutagenese, primer- 
repair u , Restriktion oder Ligation verwendet werden. ' 

Bei geeigneten Manipulationen, wie z.B. Restriktion, *chewing- 
25 back* oder Auffxillen von Uberhangen fur *bluntends w , konnen 

komplementare Enden der Fragmente fur die Ligation zur Verfiigung 
gestellt werden. 

Bevorzugte Polyadenylierungssignale sind pflanzliche Polyadeny- 
30 lierungssignale, vorzugsweise solche, die im wesentlichen T— DNA— 
Polyadenylierungssignale aus Agrobacterium tumefaciens, ins- 
besondere des Gens 3 der T-DNA (Octopin Synthase) des Ti-Plasmids 
pTiACHS entsprechen (Gielen et al . , EMBO J. 3 (1984), 835 ff) 
oder funktionelle Aquivalente . 

35 

Die Ubertragung von Fremdgenen in das Genom einer Pflanze wird 
als Transformation bezeichnet. 

Dazu konnen an sich bekannte Methoden zur Transformation und 
40 Regeneration von Pflanzen aus Pf lanzengeweben oder Pf lanzenzellen 
zur transienten oder stabilen Transformation genutzt werden. 

Geeignete Methoden zur Transformation von Pflanzen sind die Pro- 
toplastentransf ormation durch Polyethylenglykol-induzierte DNA- 
45 Aufnahme, das biolistische Verfahren mit der Genkanone - die so- 
genannte particle bombardment Methode, die Elektroporation, die 
Inkubation trockener Embryonen in DNA— ha 1 1 i ger Losung, die Mikro- 
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injektion und der, vorstehend beschriebene, durch Agrobacterium 
vermittelte Gentransfer. Die genannten Verfahren sind beispiels- 
weise in B. Jenes et al . , Techniques for Gene Transfer, in: 
Transgenic Plants, Vol. 1, Engineering and Utilization, herausge- 
5 geben von S.D. Kung und R. Wu, Academic Press (1993), 128-143 
sowie in Potrykus, Annu. Rev. Plant Physiol. Plant Molec. Biol. 
42 (1991), 205-225) beschrieben. 

Vorzugsweise wird das zu exprimierende Konstrukt in einen Vektor 
10 kloniert, der geeignet ist, Agrobacterium tumef aciens zu trans- 
formieren, beispielsweise pBinl9 (Bevan et al., Nucl. Acids Res. 
12 (1984), 8711) oder besonders bevorzugt pSUN2, pSUN3 , pSUN4 
Oder pSUN5 (WO 02/00900) . 

15 Mit einem Expressionsplasmid transf ormierte Agrobakterien konnen 
in bekannter Weise zur Transformation von Pflanzen verwendet wer- 
den, z.B. indem verwundete Blatter oder Blattstucke in einer 
Agrobakterienldsung gebadet und anschlieSend in geeigneten Medien 
kultiviert werden. 

20 

Zur bevorzugten Herstellung von genetisch ver&nderten Pflanzen, 
im folgenden auch transgene Pflanzen bezeichnet, wird die fusio- 
nierte Expressionskassette, die eine Ketolase exprimiert, in 
einen Vektor, beispielsweise pBinl9 oder insbesondere pSUN2 klo- 
25 niert, der geeignet ist, in Agrobacterium tumefaciens transf or- 
miert zu werden 

Mit einem solchen Vektor transf ormierte Agrobakterien kQnnen dann 
in bekannter Weise zur Transformation von Pflanzen, insbesondere 
30 von Kulturpf lanzen verwendet werden, indem beispielsweise verwun- 
dete Blatter oder Blattstttcke in einer Agrobakterienldsung geba- 
det und anschlie&end in geeigneten Medien kultiviert werden. 

Die Transformation von Pflanzen durch Agrobakterien ist unter 
35 anderem bekannt aus F.F. White, Vectors for Gene Transfer in 

Higher Plants; in Transgenic Plants, Vol. 1, Engineering and Uti- 
lization, herausgegeben von S.D. Kung und R. Wu, Academic Press, 
1993, S. 15-38. Aus den transf ormier ten Zellen der verwundeten 
Blotter bzw. Blattstucke konnen in bekannter Weise transgene 
40 Pflanzen regeneriert werden, die ein in die Expressionskassette 
integriertes Gen ftir die Expression einer Nukleinsaure codierend 
eine Ketolase enthalten. 

Zur Transformation einer Wirtspflanze mit einer fur eine Ketolase 
45 kodierenden Nukleinsaure wird eine Expressionskassette als Inser- 
tion in einen rekombinanten Vektor eingebaut, dessen Vektor-DNA 
zusatzliche funktionelle Regulationssignale, beispielsweise 
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Sequenzen fur Replikation Oder Integration enthalt . Geeignete 
Vektoren sind unter anderem in xv Methods in Plant Molecular Bio- 
logy and Biotechnology* (CRC Press), Kap. 6/7, S. 71-119 (1993) 
beschrieben. 

5 

Unter Verwendung der oben zitierten Rekombinations- und Klonie- 
rungs techniken konnen die Expressionskassetten in geeignete Vek- 
toren kloniert werden, die ihre Vermehrung, beispielsweise in E. 
coli, ermoglichen. Geeignete Klonierungsvektoren sind u.a. 
10 pJITH7 (Guerineau et al. (1988) Nucl. Acids Res. 16 :1138c)), 

pBR332, pUC-Serien, M13mp-Serien ,pACYC184, pMC1210, pMcl 210 und 
pCLl920. Besonders geeignet sind binare Vektoren, die sowohl in 
E. coli als auch in Agrobakterien replizieren konnen. 

15 Dabei kann je nach Wahl des Promotors die Expression konstitutiv 
oder vorzugsweise spezifisch in den Friichten erfolgen. 

Dementsprechend betriff t die Erfindung femer ein Verfahren zur 
Herstellung von genetisch ver&nderten Pflanzen, dadurch gekenn- 
20 zeichnet, dass man ein Nukleinsaurekonstrukt , enthaltend funktio- 
nell verkniipf t einen f ruchtspezif ischen Promotor und Nuklein- 
sauren kodierend eine Ketolase in das Genom der Ausgangspf fanze 
einf uhrt . 

25 Die Erfindung betrifft femer die genetisch veranderten Pflanzen, 
die im Vergleich zur Ausgangspf lanze in Fruchten eine Ketolase- 
Aktivitat aufweist. 

Die Ketolaseaktivitat wird in einer bevorzugten Ausfiihrungsf orm 
30 dadurch erreicht, dass die genetisch veranderte Pf lanze in den 
Fruchten eine Ketolase exprimiert. 

Die bevorzugten, genetisch veranderten Pflanzen enthalten daher 
in Friichten mindestens eine Nukleins&ure, kodierend eine Keto- 
35 lase. 

In einer weiter bevorzugten Ausftihrungsf orm erfolgt, wie vorste- 
hend ausgefuhrt, die Verursachung der Genexpression einer 
Nukleinsaure, kodierend eine Ketolase, durch Einbringen von 
40 Nukleinsauren, kodierend eine Ketolase, in die Ausgangspf lanze . 

Der Erfindung betrifft daher besonders bevorzugt eine vorstehend 
beschriebene genetisch veranderte Pf lanze, dadurch gekennzeich- 
net, dass man in die Pf lanze ausgehend von einer Ausgangspf lanze 
45 mindestens eine Nukleinsaure, kodierend eine Ketolase eingebracht 
hat . 
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Die Erfindung betrif ft insbesondere genetisch verSnderte Pf lan- 
zen, ausgewahlt aus den Pf lanzengattungen Actinophloeus , Aglaeo- 
nema, Ananas, Arbutus, Archontophoenix, Area, Aronia, Asparagus, 
Attalea, Berber is, Bixia, Brachychilum, Bryonia, Caliptocalix, 
5 Capsicum, Carica, Celastrus, Citrullus, Citrus, Convallaria, 
Cotoneaster, Crataegus, Cucumis, Cucurbita, Cuscuta, Cycas, 
Cyphomandra , Dioscorea, Diospyrus, Dura, Elaeagnus, Elaeis, 
Erythroxylon, Euonymus, Ficus, Fortunella, Fragaria, Gardinia, 
Gonocaryum, Gossypium, Guava, Guilielma, Hibiscus, Hippophaea, 

10 Iris, Lathyrus, Lonicera, Luff a, Lycium, Lycopersicum, Malpighia, 
Mangifera, Mormodica, Murraya, Musa, Nenga, Palisota, Pandanus, 
Passiflora, Persea, Physalis, Prunus, Ptychandra, Punica, Pyra- 
cantha, Pyrus, Ribes, Rosa, Rubus, Sabal, Sambucus, Seaforita, 
Shepherdia, Solanum, Sorbus, Synaspadix, Tabernae, Tamus, Taxus, 

15 Trichosanthes, Triphasia, Vaccinium, Viburnum, Vignia oder Vitis, 
enthaltend mindestens eine Nukleinsaure, kodierend eine Ketolase. 

Ganz besonders bevorzugte Pf lanzengattungen sind Ananas, Aspara- 
gus, Capsicum, Citrus, Cucumis, Cucurbita, Citrullus, 
20 Lycopersicum, Passiflora, Prunus, Physalis, Solanum, Vaccinium und 
Vitis, enthaltend mindestens eine transgene Nukleinsaure, kodie- 
rend eine Ketolase. * 

Wie vorstehend erw&hnt wird in bevorzugten transgenen Pflanzen 
25 die Ketolase in den FrtLchten exprimiert, besonderes bevorzugt 
ist die Expression der Ketolase in den Friichten am hochsten. 

Besonders bevorzugte, genetisch ver&nderte Pflanzen weisen, wie 
vorstehend erwahnt, zusatzlich eine erhohte Hydroxylase-Aktivitat 
30 und/oder £-Cyclase-Aktivit&t gegeniiber einer Wildpflanze auf . 
Weiter bevorzugte Au s f uhr ung s f o rmen sind vorstehend im 
erf indungsgem&fien Verfahren beschrieben. 

Die transgenen Pflanzen, deren Vermehrungsgut , sowie deren Pflan- 
35 zenzellen, -gewebe oder -teile, insbesondere deren Friichte sind 
ein weiterer Gegenstand der vorliegenden Erfindung. 

Die genetisch veranderten Pflanzen konnen, wie vorstehend 
beschrieben, zur Herstellung von Ketocarotinoiden, insbesondere 
40 Astaxanthin, verwendet werden. 

Von Menschen und Tieren verzehrbare erf indungsgemaSe, genetisch 
verSnderte Pflanzen mit erhohtem Gehalt an Ketocarotinoiden k6n- 
nen auch beispielsweise direkt oder nach an sich bekannter Pro- 
45 zessierung als Nahrungsmittel oder Futtermittel oder als Futter- 
und Nahrungserganzungsmittel verwendet werden. Ferner konnen die 
genetisch veranderten Pflanzen zur Herstellung von Ketocaroti- 
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noid-haltigen Extrakten der Pflanzen und/oder zur Herstellung von 
Futter- und Nahrungserganzungsmitteln verwendet werden. 

Die genetisch veranderten Pflanzen weisen im Vergleich zum Wild- 
5 typ einen erhohten Gehalt an Ketocarotinoiden auf. 

Unter einem erhohten Gehalt an Ketocarotinoiden wird in der 
Kegel ein erhdhter Gehalt an Gesamt-Ketocarotinoid verstanden. 

10 Unter einem erhohten Gehalt an Ketocarotinoiden wird aber auch 
insbesondere ein verSnderter Gehalt der bevorzugten Ketocaroti- 
noide verstanden, ohne dass zwangsl&ufig der Gesamt-Carotinoidge- 
halt erhoht sein muss. 

15 In einer besonders bevorzugten Ausftthrungsf orm weisen die 

erf indungsgemaSen, genetisch veranderten Pflanzen im Vergleich 
zum Wildtyp einen erhohten Gehalt an Astaxanthin auf. 

Unter einem erhohten Gehalt wird in diesem Fall insbesondere 
20 ein verursachter Gehalt an Ketocarotinoiden, bzw. Astaxanthin 
verstanden. 

s 

Die Erfindung wird durch die nun folgenden Beispiele erlautert, 
ist aber nicht auf diese beschrankt: 

25 

Allgemeine Experimentelle Bedingungen: 
Sequenzanalyse rekombinanter DNA 

Die Sequenzierung rekombinanter DNA-Molekaie erfolgte mit einem 
30 Laserf luoreszenz-DNA-Sequenzierer der Firma Licor (Vertrieb durch 
MWG Biotech, Ebersbach) nach der Methode von Sanger (Sanger 
et al., Proc. Natl. Acad. Sci . USA 74 (1977), 5463-5467). 

Beispiel 1: Amplif ikation einer cDNA, die die gesamte Primar- 
35 sequenz der Ketolase aus Haematococcus pluvialis Flo- 

tow em. Wille kodiert 

Die cDNA, die fur die Ketolase aus Haematococcus pluvialls 
kodiert, wurde mittels PCR aus Haematococcus pluvlalis .(Stamm 
40 192.80 der "Sammlung von Algenkulturen der Universitat Gottin- 
gen*) Suspensionskultur amplif iziert . 

Fur die Preparation von Total -RNA aus einer Suspensionskultur 
von Haematococcus pluvialis (Stamm 192.80), die 2 Wochen mit in- 
45 direktem Tageslicht bei Raumtemperatur in Haematococcus-.Medium 
(1.2 g/1 Natriumacetat, 2 g/1 Hefeextrakt, 0.2 g/1 MgC12x6H20, 
0.02 CaC12x2H20; pH 6.8; nach Autoklavieren Zugabe von 400 mg/1 
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L-Asparagin, 10 mg/1 FeS04xH20) gewachsen war, wurden die Zellen 
geerntet, in fliissigem Sticks toff eingefroren unci im Morser pul- 
verisiert. Anschlie&end wurden 100 mg der gefrorenen, pulveri- 
sierten Algenzellen in ein Reaktionsgef iiberftihrt und in 0,8 ml 
5 Trizol-Puf f er (Life Technologies) aufgenommen. Die Suspension 
wurde mit 0,2 ml Chloroform extrahiert. Nach 15mintttiger Zentri- 
fugation bei 12000 g wurde der wassrige Uberstand abgenommen und 
in ein neues Reaktionsgef el£ uberfiihrt und mit einem Volumen 
Ethanol extrahiert. Die RNA wurde mit einem Volumen Isopropanol 
10 gefallt, mit 75 % Ethanol gewaschen und das Pellet in DEPC Wasser 
(iiber Nacht Inkubation von Wasser mit 1/1000 Volumen Diethylpyro- 
carbonat bei Raumtemperatur , anschliefiend autoklaviert) geldst. 
Die RNA-Konzentration wurde photometrisch bestimmt. 

15 Ftir die cDNA-Synthese wurden 2.5 \ig Gesamt-RNA fiir 10 min bei 
60°C denaturiert, fur 2 min auf Eis abgekuhlt und mittels eines 
cDNA-Kits (Ready-to-go-you -prime-beads, Pharmacia Biotech) nach 
Hers tell erangaben unter Verwendung eines antisense spezifischen 
Primers (PR1 SEQ ID No. 29) in cDNA umgeschrieben. 

20 

Die Nukleinsaure codierend eine Ketolase aus Haematococcus 
pluvlalis (Stamm 192.80) wurde mittels polymerase chain reaction 
(PCR) aus Haematococcus pluvialis unter Verwendung eines sense 
spezifischen Primers (PR2 SEQ ID No. 30) und eines antisense 
25 spezifischen Primers (PR1 SEQ ID No. 29) amplif iziert . 

Die PCR-Bedingungen waren die folgenden: 

Die PCR zur Amplif ikation der cDNA, die fiir ein Ketolase Protein 
3 0 bestehend aus der gesamten Primarsequenz kodiert, erfolgte in 
einem 50 \ll Reaktionsansatz , in dem enthalten war: 



40 - 25,8 |ll Aq. Dest . 

Die PCR wurde unter folgenden Zyklusbedingungen durchgef uhrt : 



35 - 



4 



0,25 mM 
0,2 mM 
0,2 mM 
5 \ll 
0,25 \Xl 



einer Haematococcus pluvialis cDNA (hergestellt 

wie oben beschrieben) 

dNTPs 

PR1 (SEQ ID No. 29) 
PR2 (SEQ ID No. 30) 
10X PCR-Puffer (TAKARA) 
R Taq Polymerase. (TAKARA) 



45 



IX 
35X 



94°C 
94°C 
53°C 
72°C 



2 Minuten 

1 Minute 

2 Minuten 

3 Minuten 
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IX 72°C 10 Minuten 

Die PCR-Amplif ikation mit SEQ ID No. 29 und SEQ ID No. 30 resul- 
tierte in einem 1155 Bp-Fragment, das fur ein Protein bestehend 
5 aus der gesamten PrimSrsequenz kodiert (SEQ ID No . 22). Unter 
Verwendung von Standardmethoden wurde das Amplifikat in den PCR- 
Klonierungsvektor pGEM-Teasy (Promega) kloniert und der Klon 
PGKET02 erhalten. 

10 Sequenzierung des Klons pGKET02 mit dem T7- und dem SP6-Primer 
bestcitigte eine Sequenz , die sich lediglich in den drei Ko- 
dons 73, 114 und 119 in je einer Base von der publizierten Se- 
quenz X86782 unterscheidet . Diese Nukleotidaustausche wurden 
in einem unabh&ngigem Amplif ikationsexperiment reproduziert 

15 und repr&sentieren somit die Nukleotidsequenz im verwendeten Hae- 
matococcus pluvialis Stamm 192.80 (Abbildung 3 und 4, Sequenzver- 
gleiche) . 

Dieser Klon wurde daher fur die Klonierung in den Expressionsvek- 
20 tor pJITH7 (Guerineau et al. 1988, Nucl. Acids Res. 16: 11380) 
verwendet . Die Klonierung erfolgte durch Isolierung des 1027 Bp 
SpHI-Fragmentes aus pGKET02 und Ligierung in den SpHI gescfinitte- 
nen Vektor pJIT117 . Der Klon, der das Haejnatococcus? pluvialis Ke- 
tolasegen in der korrekten Orientierung als N— terminale transla- 
25 tionale Fusion mit der rbcs Transitpeptidsequenz enthalt, hei£t 
PJKET02 . 

Beispiel 2: Amplif ikation einer cDNA, die die Ketolase aus Haema- 
tococcus pluvialis Flotow em. Wille mit einem urn 14 
30 Aminosauren verktirztem N-terminus kodiert 

Die cDNA, die ftir die Ketolase aus Haematococcus pluvialis 
(Stamm 192.80) mit einem urn 14 Aminosauren verktirztem N-Termi- 
nus kodiert, wurde mittels PCR aus Haematococcus pluvialis Sus- 
35 pensionskultur {Stamm 192.80 der "Sammlung von Algenkulturen der 
Universitat G6ttingen u ) amplif iziert . 

Die Preparation von Total-RNA aus einer Suspensionskultur von 
Haematococcus pluvialis (Stamm 192.80) erfolgte wie in Beispiel 1 
beschrieben. 

40 

Die cDNA-Synthese erfolgte wie unter Beispiel 1 beschrieben. 

Die Nukleinsaure, kodierend eine Ketolase, aus Haematococcus 
pluvialis (Stamm 192.80) mit einem urn 14 Aminosauren verktirztem 
45 N-Terminus wurde mittels polymerase chain reaction (PCR) aus 

Haematococcus pluvialis unter Verwendung eines sense spezifischen 
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Primers (PR3 SEQ ID No. 31) und eines antisense spezifischen Pri- 
mers (PR1 SEQ ID No. 29) amplif iziert . 

Die PCR-Bedingungen waren die folgenden: 

Die PGR zur Amplif ikation der cDNA, die flir ein Ketolase Protein 
mit um 14 Aminosauren verkQrztem N-Terminus kodiert, erfolgte in 
einem 50 \il Reaktionsansatz , in dem enthalten ware 

10 - 4 JJ.1 einer Haematococcus pluvialis cDNA (hergestellt 

wie oben beschrieben) 
0,25 mM dNTPs 
0,2 mM PR1 (SEQ ID No. 29) 
0,2 mM PR3 (SEQ ID No. 31) 
15 - 5 Jll 10X PCR-Puffer (TAKARA) 

0,25 |Il R Taq Polymerase (TAKARA) 
- 25, 8 JIl Aq. Dest . 

Die PCR wurde unter folgenden Zyklusbedingungen durchgeftihrt : 

20 

IX 94°C 2 Minuten 

3 5X 94°C 1 Minute 

53 °C 2 Minuten 

72°C 3 Minuten 

25 IX 72°C 10 Minuten 

Die PCR-Amplif ikation mit SEQ ID No. 29 und SEQ ID No. 31 resul- 
tierte in einem 1111 Bp Fragment, das fur ein Ketolase Protein 
kodiert, bei dem N-terminalen Aminosauren (Position 2-16) durch 
30 eine einzige Aminos&ure (Leucin) ersetzt sind. 



Das Amplifikat wurde unter Verwendung von Standardmethoden in 
den PCR-Klonierungsvektor pGEM-Teasy (Promega) kloniert und der 
Klon pGKET03 erhalten. Sequenzierungen mit den Primern T7- und 

35 SP6 bestatigten eine zur Sequenz SEQ ID No. 22 identische 

Sequenz, wobei die 5 x Region (Position 1-53) der SEQ ID No. 22 im 
Amplikikat SEQ ID No. 24 durch eine in der Sequenz abweichende 
Nonamer sequenz ersetzt wurde. Dieser Klon wurde daher ftir die 
Klonierung in den Express ionsvektor pJIT117 (Guerineau et al. 

40 1988, Nucl. Acids Res. 16: 11380) verwendet . 



Die Klonierung erfolgte durch Isolierung des 985 Bp SpHI Fragmen- 
tes aus pGKET03 und Ligierung mit dem SpHI geschnittenen Vektor 
pJIT117 . Der Klon, der die Haematococcus pluvialis Ketolase mit 
45 einem um 14 Aminosauren verkurztem N-Terminus in der korrekten 
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Orientierung als N-terminale translationale Fusion mit dem rbcs 
Trans itpeptid enthalt, heifct pJKET03 . 

Beispiel 3: Amplif ikation einer cDNA, die die Ketolase aus Haema- 
5 tococcus pluvialis Flotow em. Wille (Stamm 192.80 der 

"Sammlung von Algenkulturen der Universitat Gottin- 
gen") bestehend aus der gesamten Primarsequenz und 
fusioniertem C-terminalem myc-Tag kodiert 

10 Die cDNA, die fur die Ketolase aus Ha ema tococcus pluvialis (Stamm 
192.80) bestehend aus der gesamten Primarsequenz und fusioniertem 
C-terminalem myc-Tag kodiert, wurde mittels PCR unter Verwendung 
des Plasmids pGKET02 (in Beispiel 1 beschrieben) und des Primers 
PR15 (SEQ ID No. 32) hergestellt. Der Primer PR15 setzt sich zu- 

15 sammen aus einer antisense spezifischen 3' Region (Nucleotide 

40-59) und einer myc-Tag kodierenden 5 'Region (Nucleotide 1-39). 

Die Denaturierung (5 min bei 95°C) und Annealing (langsame Abkuh- 
lung bei Raumtemperatur auf 40°C) von pGKET02 und PR15 erfolgte in 
20 einem 11/5 p,l Reaktionsansatz, in dem enthalten war: 

1 |ULg pGKET02 PlasmidDNA 
0,1 |lg PR15 (SEQ ID No. 32) 

25 Das Auffullen der 3'Enden (30 min bei 30°C) erfolgte in einem 
20 jil Reaktionsansatz, in dem enthalten war: 

- 11,5 111 pGKET02/PR15-Annealingsreaktion (hergestellt wie 

oben beschrieben) 
30 - 50 jJM dNTPs 

2 |il IX Klenow Puffer 

- 2U Klenow Enzym 



Die Nukleinsaure kodierend eine Ketolase aus Haematococcus 
35 pluvialis (Stamm 192.80) bestehend aus der gesamten Primarsequenz 
und fusioniertem C-terminalem myc-Tag wurde mittels polymerase 
chain reaction (PCR) aus Haematococcus pluvialis unter Verwendung 
eines sense spezifischen Primers (PR2 SEQ ID No. 30) und eines 
antisense spezifischen Primers (PR15 SEQ ID No. 32) amplif iziert . 

40 

Die PCR-Bedingungen waren die folgenden: 

Die PCR zur Amplif ikation der cDNA, die fOr ein Ketolase Protein 
mit fusioniertem C-terminalem myc-Tag kodiert, erfolgte in einem 
45 50 ill Reaktionsansatz, in dem enthalten war: 
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1 p.1 einer Annealingsreaktion (hergestellt wie oben 

beschrieben) 
0,25 mM dNTPs 

0,2 p PR15 (SEQ ID No. 32) 
5 - 0 , 2 JJM PR2 (SEQ ID No. 30) 

5 fll 10X PCR-Puffer (TAKARA) 
0,25 [il R Taq Polymerase (TAKARA) 
28,8 |ll Aq. Dest. 



10 Die PCR wurde unter f olgenden Zyklusbedingungen durchgef iihrt 

IX 94°C 2 Minuten 

35X 94°C 1 Minute 

53 °C 1 Minute 

15 72 °C 1 Minute 

IX 72°C 10 Minuten 



Die PCR-Amplif ikation mit SEQ ID No. 32 und SEQ ID No. 30 resul- 
tierte in einem 1032 Bp-Fragment, das fur ein Protein kodiert, 
20 bestehend aus der gesamten Primarsequenz der Ketolase aus Haema- 
tococcus pluvialis als zweifache translationale Fusion mit^dem. 
rbcS Transitpeptide am N-Terminus und dem myc-Tag am C-Terminus . 

« 

Das Amplifikat wurde unter Verwendung von Standardmethoden 
25 in den PCR-Klonierungsvektor pGEM-Teasy (Promega) kloniert und 
der Klon pGKET04 erhalten. Sequenzierungen mit den Primern T7- 
und SP6 bestatigten eine zur Sequenz SEQ ID No. 22 identische 
Sequenz, wobei die 3 'Region (Position 993-1155) der SEQ ID No. 22 
im Amplifikat SEQ ID No. 26 durch eine in der abweichende Sequenz 
30 aus 39 Bp ersetzt wurde. Dieser Klon wurde daher far die 

Klonierung in den Express ionsvektor pJIT117 (Guerineau et al. 
1988, Nucl. Acids Res. 16: 11380) verwendet. 

Die Klonierung erfolgte durch Isolierung des 1038 Bp EcoRI-SpHI 
3 5 Fragmentes aus pGKET04 und Ligierung rait dem EcoRI-SpHI geschnit- 

tenen Vektor pJIT117 . Durch die Ligation entsteht eine trans- 
. lationale Fusion zwischen dem C-Terminus der rbcS Transitpeptid- 

sequenz und dem N-Terminus der Ketolase Sequenz. Der Klon, der 

die Haematococcus pluvialis Ketolase mit fusioniertem C-termina- 
40 lem myc-Tag in der korrekten Orient ierung als translationale 

N-terminale Fusion mit dem rbcs Transitpeptid enthalt, heiSt 

p JKET4 . 

Beispiel 4: Herstellung von Express ions vektor en zur konstitutiven 
45 Expression der Haematococcus pluvialis Ketolase in 

• Lycopersicon esculentum 
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Die Expression der Ketolase aus Haematococcus pluvialis in 
L. esculentum erfolgte unter Kontrolle des konstitutiven Promo- 
ters d35S aus CaMV (Franck et al. 1980, Cell 21: 285-294) . Die 
Expression erfolgte mit dem Transitpeptid rbcS aus Erbse (Ander- 
5 son et al. 1986, Biochem J. 240:709-715). 

Die Herstellung eines Expressionsplasmides fttr die Agrobacterium- 
vermittelte Transformation der Ketolase aus Haematococcus pluvia- 
lis in I>. esculentum erfolgte unter der Verwendung des binaren 
10 Vektors pSUN3 (WO02/009 00) . 

- Zur Herstellung des Expressionsvektors pS3KET02 wurde das 
2.8 Kb Sacl-Xhol Fragment aus pJKET02 mit dem Sacl-Xhol ge- 
schnittenen Vektor pSUN3 ligiert (Abbildung 5, Konstruktkarte) . 

15 In der Abbildung 5 beinhaltet Fragment d35S den duplizierten 

35S Promoter (747 bp), Fragment rhcS das rbcS Transitpeptid aus 
Erbse (204 bp), Fragment KET02 (1027 bp) die gesamte Primar- 
sequenz kodierend fttr die Haematococcus pluvialis Ketolase, 
Fragment texrm (761 bp) das Polyadenylierungssignal von CaMV. 

20 

- Zur Herstellung des Expressionsvektors pS3KET03 wurde das 

2.7 Kb bp Sacl-Xhol Fragment aus pJKETQ3 mit dem Sacl-Xhol ge- 
schnittenen Vektor pSUN3 ligiert. (Abbildung 6, Konstrukt- 
karte) . In der Abbildung 6 beinhaltet Fragment d35S den dupli- 
25 zierten 35S Promoter (747 bp), Fragment rbcS das rbcS Transit- 
peptid aus Erbse (204 bp), Fragment KET03 (985 bp) die um 14 
terminale Aminosauren verkiirzte Primarsequenz kodierend fur die 
Haematococcus pluvialis Ketolase, Fragment term (761 bp) das 
Polyadenylierungssignal von CaMV. 

30 

Zur Herstellung des Expressionsvektors pS3KETQ4 wurde das 2 . 8 Kb 
Sacl-Xhol Fragment aus pJKET04 mit dem Sacl-Xhol geschnittenen 
Vektor pSUN3 ligiert. (Abbildung 7, Konstruktkarte). In der Ab- 
bildung 7 beinhaltet Fragment d35S den duplizierten 35S Promoter 
35 ((747 bp), Fragment rbcS das rbcS Transitpeptid aus Erbse (204 

bp), Fragment KET04 (1038 bp) die gesamte Primarsequenz codierend 
ftir die Haematococcus pluvialis Ketolase mit C-terminalem rnyc- 
Tag, Fragment term (761 bp) das Polyadenylierungssignal von CaMV. 

40 Beispiel 5 : Herstellung von Expressionsvektoren zur Expression 

der Haematococcus pluvialis Ketolase in Lycopersicon 
esculentum 

Die Expression der Ketolase aus Haejnatococcus pluvialis in 
45 L. esculentum erfolgte mit dem Transitpeptid rbcS aus Erbse 

(Anderson et-al. 1986, Biochem J. 240:709-715). Die Expression 
erfolgte unter Kontrolle einer modif izierten Version AP3P des 
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Promoters AP3 aus Arabidopsis thaliana (AL132971: Nukleotidregion 
9298-10200; Hill et al. (1998) Development 125: 1711-1721). 

Das DNA Fragment, das die AP3 Promoterregion -902 bis +15 
5 aus Arabidopsis thaliana beinhaltet, wurde mittels PCR unter 

Verwendung genomischer DNA (nach Standardmethoden aus Arabidopsis 
thaliana isoliert) sowie der Primer PR7 (SEQ ID No. 33) und PR10 
(SEQ ID No. 36) hergestellt. 

10 Die PCR-Bedingungen waren die folgenden: 

Die PCR zur Amplif ikation der DNA, die das AP3 -Promoter fragment 
(-902 bis +15) beinhaltet, erfolgte in einem 50 [ll Reaktionsan- 
satz, in dem enthalten war: 

15 

- 100 ng genomischer DNA aus A. thaliana 
0,25 mM dNTPs 

0,2 mM PR7 (SEQ ID No. 33) 
0,2 mM PR10 (SEQ ID No. 36) 
20 - 5 \il 10X PCR- Puffer (Stratagene) 

0,25 \il Pfu Polymerase (Stratagene) 
28,8 fXl Aq. Dest. 

Die PCR wurde unter folgenden Zyklusbedingungen durchgefuhrt : 

25 

IX 94°C 2 Minuten 

35X 94°C 1 Minute 

50°C 1 Minute 

72°C 1 Minute 

30 IX 72 °C 10 Minuten 

Das 922 Bp Amplif ikat wurde unter Verwendung von Standardmethoden 
in den PCR-Klonierungsvektor pCR 2.1 (Invitrogen) kloniert und 
das Plasmid pTAP3 erhalten. 

35 

Sequenzierung des Klons pTAP3 bestatigte eine Sequenz, die sich 
lediglich in durch eine Insertion (ein G in Position 9765 der 
Sequenz AL132971) und einen Basenaustausch (ein G statt ein A 
in Position 9726 der Sequenz AL132971) von der publizierten AP3 
40 Sequenz (AL132971, Nukleotidregion 9298-10200) unterscheidet . 
Diese Nukleotidunterschiede wurden in einem unabhangigen Ampli- 
f ikat ions experiment reproduziert und reprasentieren somit die 
tatsachliche Nukleotidsequenz in den verwendeten Arabidopsis 
thaliana Pflanzen. 

45 
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Die raodif izierte Version AP3P wurde mittels rekombinanter 
PCR unter Verwendung des Plasmids pTAP3 hergestellt. Die 
Region 10200-9771 wurde mit den Primern PR7 (SEQ ID No, 33) 
und Primern PR9 (SEQ ID No. 35) amplif iziert (Amplifikat A7/9), 
5 die Region 9526-9285 wurde mit den PR8 (SEQ ID No. 34) und PR10 
(SEQ ID No. 36) amplif iziert (Amplifikat A8/10) . 

Die PCR-Bedingungen waren die folgenden: 

10 Die PCR-Reaktionen zur Amplif ikation der DNA-Fragmente , die 
die Regionen Region 10200-9771 und Region 9526-9285 des AP3 
Promoters beinhalten, erfolgte in 50 Jill Reaktionsansatzen, in de- 
nen enttialten war: 



15 - 100 ng AP3 Amplifikat (oben beschrieben) 
0,25 mM dNTPs 

0,2 mM sense Primer (PR7 SEQ ID No. 33 bzw. PR8 

SEQ ID No. 35) 
0,2 mM antisense Primer (PR9 SEQ ID No. 35 bzw. PR10 
20 SEQ ID No. 36) 

5 p.1 10X PCR-Puffer (Stratagene) 
- 0,25 |ll Pfu Taq Polymerase (Stratagene) 

28, 8 JXl Aq. Dest . 

* 

25 Die PCR wurde unter folgenden Zyklusbedingungen durchgef ubrt : 



IX 94°C 2 Minuten 

35X 94°C 1 Minute 

50°C 1 Minute 

30 72°C 1 Minute 

IX 72°C 10 Minuten 



Die rekombinante PCR beinhaltet Annealing der sich tiber eine 
Sequenz von 25 Nukleotiden xiberlappenden Amplif ikate A7/9 und 

35 A8/10, Vervollstandigung zu einem Doppelstrang und anschliefcende 
Amplif izierung. Dadurch entstebt eine modif izierte Version des 
AP3 Promoters, AP3P, in dem die Positionen 9670-9526 deletiert 
sind. Die Denaturierung (5 min bei 95°C) und Annealing (langsame 
Abkiiblung bei Raumtemperatur auf 40°C) beider Amplifikate A7/9 

40 und A8/10 erfolgte in einem 17.6 «=1 Reaktionsansatz , in dem ent- 
halten war; 



45 



0,5 jug A7/9 Amplifikat 
0,25 |lg A8/10 Amplifikat 
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Das Auffullen der 3'Enden (30 min bei 30°C) erfolgte in einem 
20 ocl Reaktionsansatz, in dem enthalten war: 



17,6 p.1 A7/9 und A8/10-Annealingsreaktion (hergestellt 

5 wie oben beschrieben) 

50 MM dNTPs 

2 fll IX Klenow Puffer 

- 2U Klenow Enzym 

10 Die Nukleins&ure, kodierend fur die modifizierte Promoterversion 
AP3P, wurde mittels PCR unter Verwendung eines sense spezifischen 
Primers (PR7 SEQ ID No. 28) und eines antisense spezifischen Pri- 
mers (PR10 SEQ ID No. 36) amplif iziert . 

15 Die PCR-Bedingungen waren die folgenden: 



Die PCR zur Amplif ikation des AP3P Fragmentes erfolgte in einem 
50 jll Reaktionsansatz, in dem enthalten war; 



20 - 1 Jll Annealingsreaktion (hergestellt wie oben 

be s chr i eben ) 

0,25 mM dNTPs 

0,2 mM PR7 (SEQ ID No . 33) 

0,2 mM PR10 (SEQ ID No. 36) 

25 - 5 Jll 10X PCR-Puffer (Stratagene) 

- 0,25 Jll Pfu Taq Polymerase (Stratagene) 

28,8 Jil Aq. Dest. 



Die PCR wurde unter folgenden Zyklusbedingungen durchgefiihrt : 

30 

IX 94° C 2 Minuten 

35X 94°C 1 Minute 

50°C 1 Minute 

72°C 1 Minute 

3 5 -IX 72 °C 10 Minuten 



Die PCR-Amplif ikation mit SEQ ID No. 33 und SEQ ID No. 36 resul- 
tierte in einem 778 Bp Fragment, das fur die modif izierte Promo- 
terversion AP3P kodiert. Das Amplif ikat wurde in den Klonierungs- 

40 vektor pCR2 . 1 (Invitrogen) kloniert und der Klon pTAP3P erhalten. 
Sequenzierungen mit den Primern T7 und Ml 3 bestatigten eine zur 
Sequenz AL132971, Region 10200-9298 identische Sequenz, wobei die 
interne Region 9285-9526 deletiert wurde. Diese Klon wurde daher 
fur die Klonierung in den Expressionsvektor pJIT117 (Guerineau et 

45 al. 1988, Nucl. Acids Res. 16: 11380) verwendet. 
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Die Klonierung erfolgte durch Isolierung des 771 Bp Sacl- 
Hindlll Fragmentes aus pTAP3P und Ligierung in den Sacl-Hindlll 
geschnittenen Vektor pJIT117 . Der Klon, der den Promoter AP3P an- 
s telle des ursprtinglichen Promoters d35S enthalt, heiSt pJAP3P. 

5 

Zur Herstellung einer Expressionskassette pJAP3PKET02 wurde das 
1027 Bp SpHI-Fragment KET02 (in Beispiel 1 beschrieben) in den 
SpHI geschnittenen Vektor pJAP3P kloniert. Der Klon, der das 
Fragment KET02 in der korrekten Orientierung als N-terminale 
10 Fusion mit dem rbcS Transitpeptid enthallt, heiSt pJAP3PKET02. 

Zur Herstellung einer Expressionskassette pJAP3PKET04 wurde das 
1032 Bp SpHI-EcoRI Fragment KET04 (in Beispiel 3 beschrieben) 
in den SpHI-EcoRI geschnittenen Vektor pJAP3P kloniert. Der 
15 Klon, der das Fragment KET04 in der korrekten Orientierung als 
N-terminale Fusion mit dem rbcS Transitpeptid enthailt, heiSt 
pJAP3PKET04. 

Die Herstellung eines Express ions vektors fttr die Agrobacterium- 
20 vermittelte Transformation der AP3P-kontrollierten Ketolase 
aus Haematococcus pluvialis in L. esculentum erfolgte unter 
der Verwendung des binaren Vektors pSUN3 (WO02/00900) . ' 

- Zur Herstellung des Expressionsvektors pS3A£3PKET02 wurde das 
25 2.8 KB bp Sacl-Xhol Fragment aus pJAP3KET02 mit dem Sacl-Xhol 

geschnittenen Vektor pSUN3 ligiert (Abbildung 8, Konstrukt- 
karte) . In der Abbildung 8 beinhaltet Fragment AP3P den 
modifizierten AP3P Promoter (771 bp), Fragment rbcS das rbcS 
Transitpeptid aus Erbse (204 bp) f Fragment KETQ2 (1027 bp) die 
30 gesamte Primarsequenz codierend fur die Haematococcus pluvialis 
Ketalase, Fragment term (761 Bp) das Polyadenylierungssignal 
von CoMV. 

- Zur Herstellung des Expressionsvektors pS3AP3PKET04 wurde das 
35 2.8 KB Sacl-Xhol Fragment aus pJAP3PKET04 mit dem Sacl-Xhol 

geschnittenen Vektor pSUN3 ligiert. (Abbildung 9, Konstrukt- 
karte) . In der Abbildung 9 beinhaltet Fragment AP3P den 
modifizierten AP3P Promoter (771 bp) f Fragment rbcS das rbcS 
Transitpeptid aus Erbse (204 bp), Fragment KET04 (1038 bp) die 
40 gesamte Primarsequenz codierend f\ir die Haematococcus pluvialis 
Ketolase mit C-terminalem myc-Tag, Fragment term (761 Bp) das 
Polyadenylierungssignal von CaMV. 

Beispiel 6: Herstellung transgener Lycopersicon esculentum Pflan- 
45 zen 
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Transformation und Regeneration von Tomatenpf lanzen erfolgte nach 
der publizierten Methode von Ling und Mitarbeitern (Plant Cell 
Reports (1998), 17:843-847). Fur die Varietat Microtom wurde mit 
hoherer Kanamycin-Konzentration (lOOmg/L) selektioniert . 

5 

Als Ausgangsexplantat fur die Transformation dienten Kotyledonen 
und Hypokotyle sieben bis zehn Tage alter Keimlinge der Linie 
Microtom. Fur die Keimung wurde das Kulturmedium nach Murashige 
und Skoog (1962: Murashige and Skoog, 1962, Physiol. Plant 15, 

10 473-) mit 2 % Saccharose, pH 6,1 verwendet. Die Keimung fand bei 
21°C bei wenig Licht (20 bis 100 \IE) statt. Nach sieben bis zehn 
Tagen wurden die Kotyledonen quer geteilt und die Hypokotyle in 
ca. 5 bis 10 mm lange Abschnitte geschnitten und auf das Medium 
MSBN (MS, pH 6,1, 3 % Saccharose + 1 mg/1 BAP, 0,1 mg/1 NAA) 

15 gelegt, das am Vortag mit suspensionskultivierten Tabakzellen 

beschickt wurde. Die Tabakzellen wurden luf tblasenf rei mit steri- 
lem Filterpapier abgedeckt. Die Vorkultur der Explantate auf dem 
beschriebenen Medium erfolgte fur drei bis ftinf Tage. Zellen des 
Stammes Agrobakterium tumefaciens LBA4404 wurden einzeln mit den 

20 Plasmiden pS3KET02, pS3KET03 bzw. pS3AP3KET02 transf ormiert . Von 
den einzelnen mit den Binaervektoren pS3KET02, pS3KET03 bzw. 
pS3KET02 transf ormiert en Agrobakterium-Stammen wurde jeweiis eine 
Ubernachtkultur in YEB Medium mit Kanamycin (20 mg/1) bei 28 Grad 
Celsius kultiviert und die Zellen zentrif ugiett . Das Bakterien- 

25 pellet wurde mit flussigem MS Medium (3 % Saccharose, pH 6,1) 
resuspendiert und auf eine optische Dichte von 0,3 (bei 600 ran) 
eingestellt . Die vorkultivierten Explantate wurden in die 
Suspension tiberfuhrt und fur 30 Minuten bei Zimmertemperatur 
unter leichtem Schiitteln inkubiert. Anschliefcend wurden die 

30 Explantate mit sterilem Filterpapier getrocknet und fur die drei- 
tagige Co-Kultur (21°C) auf ihr Vorkulturmedium zuriick gelegt. 

Nach der Co-kultur wurden die Explantate auf MSZ2 Medium 
(MS pH 6,1 + 3 % Saccharose, 2 mg/1 Zeatin, 100 mg/1 Kanamycin, 

35 160 mg/1 Timentin) transf eriert und fur die selektive Regenera- 
tion bei 21°C unter Schwachlicht Bedingungen (20 bis 100 ocE, 
Lichtrhythmus 16 h / 8 h) aufbewahrt. Aller zwei bis drei Wochen 
erfolgte der Transfer der Explantate bis sich Sprosse bildeten. 
Kleine Sprosse konnten vom Explantat abgetrennt werden und auf MS 

40 (pH 6,1 + 3 % Saccharose) 160 mg/1 Timentin, 30 mg/1 Kanamycin, 
0,1 mg/1 IAA bewurzelt werden. Bewurzelte Pflanzen wurden ins Ge- 
wachshaus uberfuhrt. 
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GemaK der oben beschriebenen Trans format ionsntethode wurden mit 
folgenden Expressionskonstrukten folgende Linien erhalten: 

Mit pS3KET02 wurde erhalten: csl3-24, csl3-30, csl3-40. 

5 

Mit pS3KET03 wurde erhalten: csl4-2, csl4-3, cs!4-9, csl4-19. 

Mit pS3 AP3 PKET02 wurde erhalten: csl6-15, csl6-34, csl6-35, 
csl6-40 . 

10 

Beispiel 8: Charakterisierung der transgenen Fruchte 

Das Fruchtmaterial der transgenen Pflanzen wurde in f ltissigem 
15 Stickstoff gemorsert und das Pulver (etwa 250 bis 500 mg) mit 
100 % Aceton extrahiert (dreimal je 500 ul) . Das Ldsungs-mit- 
tel wurde evaporiert und die Carotinoide in 100 ul Aceton 
resuspendiert . 

20 Mittels einer C30-Reverse phase-Saule konnte zwischen Mono- 

und Diestern der Carotinoide unterschieden werden. HPLC-Laufbe- 
dingungen wurden modifiziert nach einer publizierten Me- r 
thode (Frazer et al.(2000), Plant Journal 24(4): 551-558). 
Folgende HPLC-Bedingungen wurden eingestellt. 

25 Trennsaule: Prontosil C30-Saule, 250 x 4,6 mm, (Bischoff, Leon- 
berg , Germany ) 
Flussrate : 1.0 ml/min 

Eluenten: Laufmittel A - 100% Methanol 

Laufmittel B - 80% Methanol, 0.2% Ainmoniumacetat 
Laufmittel C - 100% t-Butyl-methylether 

30 

Gradientenprof il : 
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Zeit 


Flussrate 


% Lauf- 


% Lauf- 


% Lauf- 






mittel A 


mittel B 


mittel C 


1.00 


1.0 


95.0 


5.0 


0 


12.00 


1.0 


95.0 


5.0 


0 


12.10 


1.0 


80.0 


5.0 


15.0 


22.00 


1.0 


76 .0 


5.0 


19 .0 


22.10 


1.0 


66.5 


5.0 


28.5 


38.00 


1.0 


15.0 


5.0 


80.0 


45.00 


1.0 


95.0 


5.0 


0 


46.0 


1.0 


95.0 


5.0 


0 



Detektion: 300 - 530 niu 

45 

Die Spektren wurden unter Verwendung eines Photodiodenarray-De- 
tektors bestimmt. Die Carotinoide wurden uber ihre Absorptions- 
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spektren und ihre Retentionszeiten im Vergleich zu Standardproben 
identif iziert . 



Tabelle 1 zeigt das Carotinoidprof il in Tomatenf ruchten der gemaS 
5 der vorstehend beschriebenen Beispiele hergestellten transgenen 
Tomaten und Kontrolltomatenpf lanzen. Im Vergleich zur genetisch 
nicht veranderten Kontrollpf lanze weisen die genetisch verander- 
ten Pf lanzen einen Gehalt an Ketocarotinoiden und insbesondere 
einen Gehalt an Astaxanthin auf . 

10 

Tabelle 1 



Pflanze 


Lutein 


Lycopin 


beta-Carotin 


Cryptoxanthin 


Canthaxanthin 


Adonirubin 


Astaxanthin 


Kontrolle 


+ 


4- 


+ 


(+> 








Kontrolle 


+ 


+ 


+ 


(+) 








CS 13-24 




4- 




(+) 


4- 






CS 13-30 




4- 


4- 


(+) 


4- 


4- 


+ 


CS 13-40 




+ 


+ 


(+) 


4- 


+ 


+■ 


CS14-2 




4- 


+ 


(+) 


+ 


+ 


4- 


CS14-3 




+ 


+ 




4- 


4- 


+ 


CS14-9 






+ 


<+) 


+ 


4- 


+ 


CS 14-19 




4- 


+ 




+ 


4- 


4- 


CS16-15 




4- 


+ 


(+) 


4- 


4- 


4- . 




CS 16-34 




4- 


+ 


(+) 


+ 


4- 


4- 


CS 16-35 




4- 


4- 




+ 


4- 


4- 


CS 16-40 




+ 


(+) 


(+) 




+ 


4- 



25 

+ bedeutet Carotinoid nachweisbar 

- bedeutet Carotinoid nicht detektiert 

( + ) bedeutet Carotinoidkonzentration an der Nachweisgrenze 



30 

Tabelle 2a zeigt die Carotinoidmengen in reifen Fruchten von 
transgenen Tomaten und Kontrollpf lanzen. Die Angaben sind Mittel- 
werte verschiedener Linine und in Prozent des Gesamtcarotinoidge- 
halt angegeben. 



Promoter 
used 


Lycopene 


Beta-ca- 
rotene 


Lutein 


Cantha- 
xanthin 


Adoni- 
rubin 


Astaxanthin 


Zeaxanthin 


Control 
plants 


80.5 


14.4 


2.8 








0.2 


CS16 


84 


9.4 


0.3 


0.5 


0.2 


5.0 


0.3 


CS13 


78 


16.5 


2.8 


0.3 


0.2 


6.1 





40 

Tabelle 2b zeigt die Carotinoidmengen in reifenden Fruchten von 
transgenen Tomaten und Kontrollpf lanzen. Die Angaben sind Mittel- 
werte verschiedener Linine und in Prozent des Gesamtcarotinoidge- 
halt angegeben. 
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Promoter 
used 


Lycopene 


Beta-ca- 
rotene 


Lutein 


Cantha- 
xanthin 


Adonirubin 


Astaxanthin 


Zeaxanthin 


Control 
plants 


59 


28.4 


9 








0.3 


CS16 


61 


22.3 


5.2 


L6 


3.1 


3.9 


2,5 


CS13 


52 


19.5 


5.4 


1.2 


4.7 


6.1 





Beispiel 9 : 

10 Amplif ikation einer DNA, die die gesamte Primarsequenz der 
NP196-Ketolase aus Nostoc punctiforme ATCC 29133 kodiert 

Die DNA, die fur die NP196-Ketolase aus Nostoc puncti forme ATCC 
29133 kodiert, wurde mittels PGR aus Nostoc puncti forme ATCC 
15 29133 (Stamm der "American Type Culture Collection") amplif i- 
ziert . 

Fur die Preparation von genomischer DNA aus einer Suspensionskul- 
tur von Nostoc punctiforme ATCC 29133, die 1 Woche mit Dauerlicht 

20 konstantem Schtitteln (150 rpm) at 25°C in EG 21-Medium (1.5 

g/1 NaN0 3 , 0.04 g/1 K 2 P0 4 x3H 2 0, 0.075 g/1 MgS0 4 xH 2 0, 0.036 g/1 
CaCl2x2H 2 0 / 0.006 g/1 citric acid, 0.006 g/1 Ferric ammonium ci- 
trate, 0.001 g/1 EDTA disodium magnesium, 0.04 g/1 Na 2 C03 , 1ml 
Trace Metal Mix *A5+Co" (2.86 g/1 H3BO3, 1.81 £/l MnCl 2 x4H 2 o, 

25 0.222 g/1 ZnSO 4 x7H 2 0, 0.39 g/1 NaMo0 4 X2H 2 o, 0.079 g/1 CuS0 4 x5H 2 0, 
0.0494 g/1 Co(N0 3 ) 2 x6H 2 0) gewachsen war, wurden die Zellen durch 
Zentrifugation geerntet, in flussigem Stickstoff eingefroren und 
im Morser pulverisiert . 

30 Protokoll fur die DNA-Isolation aus Nostoc puncti forme ATCC 
29133: 

Aus einer 10 ml Fltissigkultur wurden die Bakterienzellen durch. 10 
minutige Zentrifugation bei 8000 rpm pelletiert. AnschlieSend 
wurden die Bakterienzellen in fliissigem Stickstoff mit einem Mor- 
35 ser zerstoSen und gemahlen. Das Zellmaterial wurde in 1 ml lOmM 
Tris_HCl (pH 7.5) resuspendiert und in ein Eppendorf-Reaktionsge- 
fa£ (2ml Volumen) tiberfiihrt. Nach Zugabe von 

100 ill Proteinase K (Konzentration: 20 mg/ml) wurde die Zell- 
suspension fur 3 Stunden bei 37°C inkubiert. AnschlieSend wurde 

40 die Suspension mit 500 fXl Phenol extrahiert. Nach 5mintitiger 

Zentrifugation bei 13 000 upm wurde die obere, wassrige Phase in 
ein neues 2 ml-Eppendorf-Reaktionsgef a£ uberfiihrt. Die Extraktion 
mit Phenol wurde 3mal wiederholt. Die DNA wurde durch Zugabe von 
1/10 Volumen 3 M Natriumacetat (pH 5.2) und 0.6 Volumen Iso- 

45 propanol gefallt und anschliefiend mit 7 0% Ethanol gewaschen. Das 
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DNA- Pellet' wurde bei Raumtemperatur getrocknet, in 25 \ll Wasser 
aufgenommen und unter Erhitzung auf 65°C gelost. 

Die Nukleinsaure, kodierend eine Ketolase aus Nostoc puncti forme 
5 ATCC 29133, wurde mittels "polymerase chain reaction" (PGR) aus 
Nostoc puncti forme ATCC 29133 unter Verwendung eines sense-spezi- 
fischen Primers (NP196-1, SEQ ID No. 59) und eines antisense-spe- 
zifischen Primers (NP196-2 SEQ ID No. 60) amplif iziert . 

10 Die PCR-Bedingungen waren die folgenden: 

Die PCR zur Amplif ikation der DNA, die filr ein Ketolase Protein 
bestehend aus der gesamten Prim&rsequenz kodiert, erfolgte in 
einem 50 ul Reaktionsansatz , in dem enthalten war: 

15 

1 ul einer Nostoc punctiforme ATCC 29133 DNA (hergestellt wie 
oben beschrieben) 
0.25 mM dNTPs 

0.2 mM NP196-1 (SEQ ID No. 59) 
20 - 0.2 mM NP196-2 (SEQ ID No. 60) 
5 ul 10X PCR- Puffer (TAKARA) 

0.25 ul R Taq Polymerase (TAKARA) ' 
- 25.8 ul Aq. Dest. 

25 Die PCR wurde unter folgenden Zyklusbedingungen durchgeftihrt : 



IX 94°C 2 Minuten 

3 5X 94°C 1 Minute 

55 °C 1 Minuten 

30 72°C 3 Minuten 

IX 72°C 10 Minuten 



Die PCR-Amplif ikation mit SEQ ID No. 59 und SEQ ID No. 60 resul- 
tierte in einem 792 Bp-Fragment, das fur ein Protein bestehend 
35 aus der gesamten Primarsequenz kodiert (NP196, SEQ ID No. 61) . 

Unter Verwendung von Standardmethoden wurde das Amplif ikat in den 
PCR-Klonierungsvektor pCR 2.1 (Invitrogen) kloniert und der Klon 
pNP19 6 erhalten. 

40 Sequenzierung des Klons pNP196 mit dem M13F- und dem M13R~Primer 
bestatigte eine Sequenz, welche mit der DNA~Sequenz von 
140.571-139.810 des Datenbank-eintrages NZ_AABC0100019 6 identisch 
ist (inverse orientiert zum verof f entlichen Datenbankeintrag) mit 
der Ausnahme, daS G in Position 140.571 durch A ersetzt wurde, um 

45 ein Standard-Startkodon ATG zu erzeugen. Diese Nukleotidsequenz 
wurde in einem unabhangigem Amplif ikat ionsexperiment reproduziert 
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und reprasentiert somit die Nukleotidsequeriz im verwendeten No- 
stoc puncti forme ATCC 29133. 

Dieser Klon pNPl96 wurde daher fur die Klonierung in den Expres- 
5 sionsvektor pJAP3P (in Beispiel 5 beschrieben) verwendet . 

PJAP3P wurde modifiziert, indem der 35S-Terminator durch den OCS- 
Terminator (Octopine Synthase) des Ti-Plasmides pTil5955 von 
Agrobacterium tumefaciens (Datenbankeintrag X00493 von Position 
10 12,541-12,350, Gielen et al . (1984) EMBO J. 3 835-846) ersetzt 
wurde , 



Das DNA-Fragment , das die OCS-Terminatorregion beinhaltet, wurde 
mittels PCR unter Verwendung des Plasmides pHELLSGATE (Datenban- 
15 keintrag AJ311874, Wesley et al . (2001) Plant J. 27 581-590, nach 
Standardrnethoden aus E.coli isoliert) sowie der Primer OCS-1 (SEQ 
ID No. 63) und OCS-2 (SEQ ID No. 64) hergestellt. 

Die PCR-Bedingungen waren die folgenden: 

20 

Die PCR zur Amplif ikation der DNA, die die Octopin Synthase (OCS) 
Terminator region (SEQ ID 65) beinhaltet, erfolgte in einem^SO ul 
Reaktionsansatz , in dem enthalten waren: 

25 - 100 ng pHELLSGATE plasmid DNA 
0.25 mM dNTPs 

0.2 mM OCS-1 (SEQ ID No. 63) 
0.2 mM OCS-2 (SEQ ID No. 64) 
5 ul 10X PCR-Puffer (Stratagene) 
30 - 0.25 ul Pfu Polymerase (Stratagene) 
28.8 ul Aq. Dest. 



Die PCR wurde unter folgenden Zyklusbedingungen durchgef tihrt : 

35 IX 94°C 2 Minuten 

35X 94°C 1 Minute 

50°C 1 Minute 

72 °C 1 Minute 

IX 72°C 10 Minuten 



40 



Das 210 bp Amplif ikat wurde unter Verwendung von Standardrnethoden 
in den PCR-Klonierungsvektor pCR 2.1 (Invitrogen) kloniert und 
das Plasmid pOCS erhalten. 



45 
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Sequenzierung des Klons pOCS bestatigte eine Sequenz, die mit 
einem Sequenzabschnitt auf dem Ti-Plasmid pTil5955 von Agrobacte- 
rium tumef aciens (Datenbankeintrag X00493) von Position 12.541 
bis 12.350 ubereinstimmt . 

5 

Die Klonierung erfolgte durch Isolierung des 210 bp Sall-Xhol 
Fragment es aus pOCS und Ligierung in den Sall-Xhol geschnittenen 
Vektor pJAP3P. 

10 Dieser Klon heisst pJOAP und wurde daher fur die Klonierung in 
den Expressionsvektor pJOAP:NP196 verwendet. 

Die Klonierung erfolgte durch Isolierung des 782 Bp Sphl-Fragmen- 
tes aus pNP196 und Ligierung in den SphI geschnittenen Vektor 
15 pJOAP. Der Klon, der die NPl96-Ketolase von Nostoc punctiforme in 
der korrekten Orientierung als N-terminale translationale Fusion 
mit dem rbcS Transitpeptid enthalt, heisst pJOAP:NP196. 

Beispiel 10 : 

20 

Herstellung von Expressionsvektoren zur f ruchtspezif ischen Ueber- 
expression der NPl96-Ketolase aus Nostoc punctiforme ATCC i 9133 
(Stamm der "American Type Culture Collection") in Lycopersicon 
esculentum 

25 Die Expression der NP196-Ketolase aus Nostoc punctxfozme in Jd. 
esculentum erfolgte mit dem Transitpeptid rbcS aus Erbse (Ander- 
son et al. 1986, Biochem J. 240:709-715). Die Expression erfolgte 
unter Kontrolle des Promoters AP3P aus Arabidopsis thaliana (in 
Beispiel 5 beschrieben) . 

30 

Die Herstellung eines Express ions vek tors fur die Agrobacterium- 
vermittelte Transformation der AP3P-kont roll ier ten NP196-Ketolase 
aus Nostoc punctiforme ATCC 29133 in L. esculentum erfolgte unter 
der Verwendung des binaren Vektors pSUN3 (WO02/00900) . 

35 

Zur Herstellung des Expressionsvektors MSP120 wurde das 1.958 KB 
bp Sacl-Xhol Fragment aus pJOAP:NP196 mit dem Sacl-Xhol geschnit- 
tenen Vektor pSUN3 ligiert (Abbildung 10, Konstruktkarte) . In 
der Abbildung 10 beinhaltet Fragment AP3P PROM den AP3P Promoter 
40 (765 bp) , Fragment rbcS TP FRAGMENT das rbcS Transitpeptid aus 
Erbse (194 bp), Fragment NP196 KETO CDS (761 bp), kodierend fur 
die Nostoc punctiforme NPl96-Ketolase, Fragment OCS Terminator 
(192 bp) das Polyadenylierungssignal von Octopin-Synthase . 



45 
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Beispiel 11: 

Amplif ikation einer DNA, die die gesamte Primarsequenz der NOST- 
Ketolase aus Nostoc spp. PCC 7120 codiert 

5 

Die DNA, die fur die NOST-Ketolase aus Nostoc punctifozrme PCC 
7120 kodiert, wurde mitt els PGR aus Nostoc PCC 7120 (Stamm der 
"Pasteur Culture Collection of Cyanobacterium" ) amplif iziert . 

10 Fur die Preparation von genomischer DNA aus einer Suspensionskul- 
tur von aus Nostoc spp. PCC 7120 1 die 1 Woche mit Dauerlicht und 
konstantem Schutteln (150 rpm) at 2 5°C in BG 21-Medium (1.5 g/1 
NaN0 3 , 0.04 g/1 K 2 P0 4 x3H 2 0, 0.075 g/1 MgS0 4 xH 2 0, 0.036 g/1 
CaCl 2 x2H 2 0, 0.006 g/1 citric acid, 0.006 g/1 Ferric ammonium ci- 

15 trate, 0.001 g/1 EDTA disodium magnesium, 0.04 g/1 Na 2 C0 3 , 1ml 
Trace Metal Mix *A5+Co" (2.86 g/1 H3BO3, 1.81 g/1 MnCl 2 x4H 2 o, 
0.222 g/1 ZnSO 4 x7H 2 0, 0.39 g/1 NaMo0 4 X2H 2 o, 0.079 g/1 CuS0 4 x5H 2 0, 
0.0494 g/1 Co (NO3 ) 2 x6H 2 0) gewachsen war, wurden die Zellen durch 
Zentrif ugation geerntet, in fltissigem Stickstoff eingefroren und 

20 im Morser pulverisiert . 

Protokoll far die DNA-Isolation aus aus Nostoc spp. PCC 7l20z 

Aus einer 10 ml Fliissigkultur wurden die Bakterienzellen durch 10 
25 minutige Zentrif ugation bei 8000 rpm pelletiert. Anschlie&end 

wurden die Bakterienzellen in f Itissigem Stickstoff mit einem Mor- 
ser zerstoEen und gemahlen. Das Zellmaterial wurde in 1 ml lOmM 
Tris_HCl (pH 7.5) resuspendiert und in ein Eppendorf -Reaktionsge- 
f££ (2ml Volumen) liberfuhrt. Nach Zugabe von 
30 100 |Lil Proteinase K (Konzentration: 20 mg/ml) wurde die Zell- 
suspension fur 3 Stunden bei 37°C inkubiert. Anschliefiend wurde 
die Suspension mit 500 |J.l Phenol extrahiert. Nach Sminutiger 
Zentrif ugation bei 13 000 upm wurde die obere, wassrige Phase in 
ein neues 2 ml-Eppendorf-Reaktionsgef aS tiberfuhrt. Die Extraktion 
35 mit Phenol wurde 3mal wiederholt. Die DNA wurde durch Zugabe von 
1/10 Volumen 3 M Natriumacetat (pH 5.2) und 0.6 Volumen Iso- 
propanol gefallt und anschlieSend mit 70% Ethanol gewaschen. Das 
DNA-Pellet wurde bei Raumtemperatur getrocknet, in 25 |Xl Wasser 
aufgenommen und unter Erhitzung auf 65°C gelost. 

40 

Die Nukleinsaure, kodierend eine Ketolase aus Nostoc PCC 7120, 
wurde mittels ^polymerase chain reaction" (PCR) aus Nostoc PCC 
7120 unter Verwendung eines sense-spezif ischen Primers (NOST-1, 
SEQ ID No. 66) und eines antisense-spezif ischen Primers (NOST-2 
45 SEQ ID No. 67) amplif iziert . 
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Die PCR-Bedingungen war en die folgenden: 



Die PCR zur Amplif ikation der DNA, die fur ein Ketolase Protein 
bestehend aus der gesamten Primarsequenz kodiert, erfolgte in 
5 einem 50 ul Reaktionsansatz, in dem enthalten war: 



1 ul einer Nostoc PCC 7120 DNA (hergestellt wie in Beispiel 9 
beschrieben) 
0.25 mM dNTPs 
10 - 0.2 irM NOST-1 (SEQ ID No. 66) 
0.2 mM NOST-2 (SEQ ID No. 67) 
5 ul 10X PCR-Puffer (TAKARA) 
0.25 ul R Taq Polymerase (TAKARA) 
25.8 ul Aq. Dest. 

15 

Die PCR wurde unter folgenden Zyklusbedingungen durchgefxihrt : 

IX 94°C 2 Minuten 

35X 94°C 1 Minute 

20 55°C 1 Minuten 

72°C 3 Minuten 

IX 72°C 10 Minuten ' 



Die PCR-Ampl if ikation mit SEQ ID No. 66 und SfiQ ID No. 67 resul- 
25 tierte in einem 809 Bp-Fragment, das far ein Protein bestehend 
aus der gesamten Primarsequenz kodiert (SEQ ID No. 68) . Unter 
Verwendung von Standardmethoden wurde das Amplif ikat in den PCR- 
Klonierungsvektor pGEM-T (Promega) kloniert und der Klon pNOST 
erhalten. 

30 

Sequenzierung des Klons pNOST mit dem M13F- und dem M13R-Primer 
bestStigte eine Sequenz, welche mit der DNA-Sequenz des Datenban- 
keintrages AP003592 identisch ist. Diese Nukleotidsequenz wurde 
in einem unabhangigem Amplif ikationsexperiment reproduziert und 
35 reprasentiert somit die Nukleotidsequenz im verwendeten Nostoc 
PCC 7120. 

Dieser Klon pNOST wurde daher fur die Klonierung in den Expres- 
sionsvektor pJOAP (in Beispiel 9 beschrieben) verwendet. 

40 

Die Klonierung erfolgte durch Isolierung des 799 Bp Sphl-Fragmen- 
tes aus pNOST und Ligierung in den SphI geschnittenen Vektor 
pJOAP. Der Klon, der die NOST-Ketolase von Nostoc PCC7120 in der 
korrekten Orientierung als N-terminale translationale Fusion mit 
45 dem rbcS Transitpeptid enthalt, heisst pJ0AP:N0ST 
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Beispiel 12: 

Herstellung von Expressionsvektoren zur f ruchtspezif ischen Ueber- 
expression der NOST-Ketolase aus Nostoc spp. PCC 7120 in 
5 Lycopersicon esculentum. 

Die Expression der NOST-Ketolase aus Nostoc spp. PCC 7120 in L. 
esculentum erfolgte mit dem Transitpeptid rbcS aus Erbse (Ander- 
son et al. 1986, Biochem J. 240:709-715) . Die Expression erfolgte 
10 unter Kontrolle des Promoters AP3P aus Arabidopsis thaliana (in 
Beispiel 5 beschrieben) . 

Die Herstellung eines Expressionsvektors fur die Agrobacterium- 
vermittelte Transformation der AP3P-kontrollierten NOST-Ketolase 
15 aus Nostoc spp. PCC 7120 in L. esculentum erfolgte unter der 
Verwendung des bin&ren Vektors pSUN3 (WO02/00900) . 

Zur Herstellung des Expressionsvektors MSP121 wurde das 1.982 KB 
bp Sacl-Xhol Fragment aus pJ0AP:NOST mit dem Sacl-Xhol geschnit- 

20 tenen Vektor pSUN3 ligiert (Abbildung 11, Konstruktkarte) . In 
der Abbildung 11 beinhaltet Fragment AP3P PROM den AP3P Promoter 
(765 bp) , Fragment rbcS TP FRAGMENT das rbcS Trans itpeptid^aus 
Erbse (194 bp), Fragment NOST KETO CDS (774 bp), kodierend fur 
die Nostoc spp. PCC 7120 NOST-Ketolase, Fragment OCS Terminator 

25 (192 bp) das Polyadenylierungssignal von Oct op in- Synthase . 

Beispiel 13 : 

Amplif ikation einer DNA, die die gesamte Primarsequenz der 
30 NPl95-Ketolase aus Nostoc puncti forme ATCC 29133 codiert 

Die DNA, die fxir die NP195-Ketolase aus Nostoc puncti forme ATCC 
29133 kodiert, wurde mittels PCR aus Nostoc puncti forme ATCC 
29133 (Stamm der "American Type Culture Collection") amplif i- 
35 ziert. Die Preparation von genomischer DNA aus einer Suspen- 

sionskultur von Nostoc punctifomne ATCC 29133 wurde in Beispiel 9 
beschrieben. 

Die Nukleinsaure, kodierend eine Ketolase aus Nostoc puncti forme 
40 ATCC 29133, wurde mittels "polymerase chain reaction" (PCR) aus 
Nostoc punctiforme ATCC 29133 unter Verwendung eines sense-spezi- 
f ischen Primers (NP195-1, SEQ ID No. 70) und eines antisense-spe- 
zif ischen Primers (NP195-2 SEQ ID No. 71) amplif iziert . 

45 Die PCR-Bedingungen waren die folgenden: 
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Die PCR zur Amplif ikation der DNA, die fur ein Ketolase Protein 
bestehend aus der gesamten Primarsequenz kodiert, erfolgte in 
einem 50 ul Reaktionsansatz, in dem enthalten war: 



5 - 1 ul einer Nostoc puncti forme ATCC 29133 DNA (hergestellt wie 
in Beispiel 9 beschrieben) 
0.25 mH dNTPs 

0.2 mM NP195-1 (SEQ ID No. 70) 
0.2 mM NP195-2 (SEQ ID No. 71) 
10 - 5 ul 10X PCR-Puffer (TAKARA) 

0.25 ul R Taq Polymerase (TAKARA) 
- 25.8 ul Aq. Dest. 



Die PCR wurde unter folgenden Zyklusbedingungen durchgef iihrt ; 

15 

IX 94°C 2 Minuten 

35X 94°C 1 Minute 

55°C 1 Minuten 

72 °C 3 Minuten 

20 IX 72°C 10 Minuten 



Die PCR-Amplif ikation mit SEQ ID No. 70 und SEQ ID No. 71 ifesul- 
tierte in einem 819 Bp-Fragment , das fiir ein Protein bestehend 
aus der gesamten Primarsequenz kodiert (SEQ ID No. 72) . Unter 
25 Verwendung von Standardmethoden wurde das Amplif ikat in den PCR- 
Klonierungsvektor pGEM-T (Promega) kloniert und der Klon pNP195 
erhalten. 



Sequenzierung des Klons pNP195 mit dem M13F- und dem M13R-Primer 
30 bestatigte eine Sequenz, welche mit der DNA-Sequenz von 

55,604-56,392 des Datenbank-eintrages NZ__AABC010001965 identisch 
ist, mit der Ausnahme, da£ T in Position 55.604 durch A ersetzt 
wurde, um ein Standard-Startkodon ATG zu erzeugen. Diese 
Nukleotidsequenz wurde in einem unabhangigem Amplif ikationsexpe- 
35 riment reproduziert und reprasentiert somit die Nukleotidsequenz 
im verwendeten Nostoc puncti forme ATCC 29133. 

Dieser Klon pNP195 wurde daher fur die Klonierung in den Expres- 
sionsvektor pJOAP (in Beispiel 9 beschrieben) verwendet. 

40 

Die Klonierung erfolgte durch Isolierung des 709 Bp Sphl-Fragmen- 
tes aus pNP195 und Ligierung in den SphI geschnittenen Vektor 
pJOAP. Der Klon, der die NP195-Ketolase von Nostoc punctl forme 
ATCC 29133 in der korrekten Orientierung als N-terminale transla- 
45 tionale Fusion mit dem rbcS Transitpeptid enthalt, heisst 
pJOAP:NPl95. 
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Beispiel 14: 

Herstellung von Expressionsvektoren zur f ruchtspezif ischen Ueber- 
expression der NP195-Ketorase aus Nostoc punctiforme ATCC 29133 
5 in Lycopersicon esculentum 

Die Expression der NP195-Ketolase aus Nostoc punctiforme ATCC 
29133 (Stamm der ''American Type Culture Collection") in I>. escu- 
lentum erfolgte mit dem Transitpeptid rbcS aus Erbse (Anderson et 
10 al. 1986, Biochem J. 240:709-715) . Die Expression erfolgte unter 
Kontrolle des Promoters AP3P aus Arabidopsis thaliana (in Bei- 
spiel 5 beschrieben) . 

Die Herstellung eines Express ions vektors fur die Agrobacterium- 
15 venaittelte Transformation der AP3P-kontrollierten NP195-Ketolase 
aus Nostoc punctiforme ATCC 29133 in L. esculentum erfolgte unter 
der Verwendung des bin^ren Vektors pSUN3 (WO02/00900) . 

Zur Herstellung des Expressionsvektors MSP122 wurde das 1.992 KB 
20 bp Sacl-Xhol Fragment aus pJOAP:NP195 mit dem Sacl-Xhol geschnit- 
tenen Vektor pSUN3 ligiert (Abbildung 12, Konstruktkarte) . In 
der Abbildung 12 beinhaltet Fragment AP3P PROM den AP3P Pr6moter 
(765 bp) , Fragment rbcS TP FRAGMENT das rbcS Transitpeptid aus 
Erbse (194 bp), Fragment NP195 KETO CDS (789 £p) , kodierend fur 
25 die Nostoc punctiforme ATCC 29133 NPl95-Ketolase, Fragment OCS 
Terminator (192 bp) das Polyadenylierungssignal von Octopin-Syn- 
thase • 

Beispiel 15 : 

30 

Amplif ikation einer DNA, die die gesamte Primarsequenz der NODK- 
Ketolase aus Nodularis spumignea NSOR10 codiert. 

Die DNA, die fur die Ketolase aus Nodularia spumignea NSOR10 ko- 
diert, wurde mittels PCR aus Nodularia spumignea NSOR10 amplif i- 
35 ziert. 

Fiir die Preparation von genomischer DNA aus einer Suspensionskul- 
tur von Nodularia spumignea NSOR10 , die 1 Woche mit Dauerlicht 
und konstantem Schutteln (150 rpm) at 25°C in BG 11-Medium (1.5 

40 g/1 NaN0 3 , 0.04 g/1 K 2 P0 4 x3H 2 0, 0.075 g/1 MgS0 4 xH 2 0, 0.036 g/1 

CaCl2x2H20, 0.006 g/1 citric acid, 0.006 g/1 Ferric ammonium ci- 
trate, 0.001 g/1 EDTA disodium magnesium, 0.04 g/1 Na 2 CC>3 , 1ml 
Trace Metal Mix "A5+Co" (2.86 g/1 H 3 B0 3 , 1.81 g/1 MnCl 2 x4H 2 o, 
0.222 g/1 ZnSO 4 x7H 2 0, 0.39 g/1 NaMo0 4 X2H 2 o, 0.079 g/1 CuS0 4 x5H 2 0, 

45 0.0494 g/1 Co (N0 3 ) 2 x6H 2 0) gewachsen war, wurden die Zellen durch. 
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Zentrifugation geerntet, in fliissigem Stickstoff eingefroren unci 
im Morser pulverisiert . 

Protokoll fiir die DNA-Isolation aus NoduXaria spumignea NSOR10 : 

5 

Aus einer 10 ml Flussigkultur wurden die Bakterienzellen durch 10 
mintitige Zentrifugation bei 8000 rpm pelletiert. AnschlieSend 
wurden die Bakterienzellen in fltissigem Stickstoff mit einem Mor- 
ser zerstofien und gemahlen. Das Zellmaterial wurde in 1 ml 10mM 

10 Tris_HCl (pH 7.5) resuspendiert und in ein Eppendorf-Reaktionsge- 
faS (2ml Volumen) uberfuhrt. Nach Zugabe von 100 \il Proteinase K 
(Konzentration: 20 mg/ml) wurde die Zellsuspension f\ir 3 Stunden 
bei 37°C inkubiert . AnschlieSend wurde die Suspension mit 500 jxl 
Phenol extrahiert. Nach Sminutiger Zentrifugation bei 13 000 upm 

15 wurde die obere, wassrige Phase in ein neues 2 ml-Eppendorf-Reak- 
tionsgef a£ iiberf tihrt . Die Extraktion mit Phenol wurde 3mal wie- 
derholt. Die DNA wurde durch Zugabe von 1/10 Volumen 3 M Natrium- 
acetat (pH 5.2) und 0.6 Volumen Isopropanol gefallt und anschlie- 
£end mit 70% Ethanol gewaschen. Das DNA-Pellet wurde bei Raumtem- 

20 peratur getrocknet, in 25 Jll Wasser aufgenommen und unter Erhit- 
zung auf 65°C gelost. 

S 

Die Nukleinsaure, kodierend eine Ketolase aus Nodularia spumignea 
NSOR10, wurde mittels ^polymerase chain reaction" (PCR) aus JNTodu- 
25 laria spumignea NSOR10 unter Verwendung eines sense-spezif ischen 
Primers (NODK-1, SEQ ID No. 74) und eines antisense-spezif ischen 
Primers (NODK-2 SEQ ID No. 75) amplif iziert . 

Die PCR-Bedingungen waren die folgenden: 

30 

Die PCR zur Amplif ikation der DNA, die fiir ein Ketolase Protein 
bestehend aus der gesamten Primarsecjuenz kodiert, erfolgte in 
einem 50 ul Reaktionsansatz , in dem enthalten war: 



35 - 1 ul einer Nodularia spumignea NSOR10 DNA (hergestellt wie 
oben beschrieben) 
0.25 itiM dNTPs 

0.2 mM NODK-1 (SEQ ID No. 74) 
0.2 mM NODK-2 (SEQ ID No. 75) 
40 - 5 ul 10X PCR-Puffer (TAKARA) 

0.25 ul R Taq Polymerase (TAKARA) 
25.8 ul Aq. Dest. 



Die PCR wurde unter folgenden Zyklusbedingungen durchgefuhrt : 

45 

IX 94°C 2 Minuten 

35X 94°C 1 Minute 
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55°C 1 Minuten 

72°c 3 Minuten 

lx 72°C 10 Minuten 

Unt er v«— »« von una der Klon 

PCR-Klonierungsvektor pCR 2.1 (Invmroge 

10 pNODK erhalten. 

se^ieruns des Klons pKO^ »i * - -f^ 19 

bestatigte eine Sequenz, welohe mit der DBA ^ i)jn _ 

wendeten Nodularia spumigrnea NSOR10. 

20 «~« Kion pnodk ^^t:^^^::.^ 1 "" 

sionsvektor pJOAP (in Bexspxel 9 beschrieben) 
Die Klonierun* e^e durcb 

25 pJOAP. Der Klon, der dxe NODK-Ketolase . nale tra nslatio- 

NSOR10 in der korrekten Orientierung als "r^f^.t 
nale Fusion mit dem rbcS Transitpeptxd enthalt, hexsst 

pJOAP:NODK. 
30 Beispiel 16: 

Herstellun. von B^essionsvektoren ^J^^^^"" 
expression der NODK-Ketolase aus Wodularxa spvmxg 
Lycopersicon esculentum. 

" Di e session a- ™Ce ^^X^^ ^ 

ST^i^TS Probers - «~ 

40 liana (in Beispiel 5 beschrieben). 
Die Hers.e^g sines 

ve™i tC e lt e ^ £ °-;- esculent erfolgte unter 

aus wostoc P unctlforme .. flrcC , r „"„ s pSUM3 (WO02/00900) . 
45 der Verwendung des binaren vektors psunj ( 
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Zur Herstellung des Expressionsvektors MSP123 wurde das 1.893 KB 
bp Sacl-Xhol Fragment aus pJOAP:NODK mit dem Sacl-Xhol geschnit- 
tenen Vektor pSUN3 ligiert (Abbildung 13, Konstruktkarte) . In 
der Abbildung 13 beinhaltet Fragment AP3P PROM den AP3P Promoter 
5 (765 bp) , Fragment rbcS TP FRAGMENT das rbcS Transitpeptid aus 
Erbse (194 bp), Fragment NODK KETO CDS (690 bp), kodierend fur 
die Nodularia spumignea NSOR10 NODK-Ketolase , Fragment OCS Termi- 
nator (192 bp) das Polyadenylierungssignal von Octopin- Synthase . 

10 Beispiel 17: Herstellung einer Expressionskassette zur fruchtspe- 
zifischen Ueberexpression der chromoplastenspezif ischen b-Hydro- 
xylase aus Lycopersicon esculentum. 

Die Expression der chromoplastenspezif ischen fe-Hydroxylase aus 
15 Lycopersicon esculentum in Tomate erfolgt unter Kontrolle des 
fruchtspezif ischen Promoters AP3P aus Arabidopsis (Beispiel 2) . 
Als Terminatorelement wird LB 3 (Datenbank-eintrages AX696005) aus 
Vicia faba verwendet . Die Sequenz der chromoplastenspezif ischen 
^-Hydroxylase (Datenbank-eintrages Y14810 & BE354440) wurde durch 
20 RNA Isolierung, reverse Transkription und PCR hergestellt. 

Das DNA-Fragment, das die LB3-Terminatorregion beinhaltet , 7 wurde 
mittels PCR isoliert. 

. c 

25 Genomische DNA aus Vicia jfaJba-Gewebe nach Standardmethoden wird 
isoliert und durch genomische PCR unter Verwendung der Primer 
PR206 (SEQ ID No. 78) und PR207 (SEQ ID No . 79) eingesetzt . Die 
PCR zur Amplif ikation dieses LB3 DNA-Fragmentes, erfolgt in einem 
50 ul Reaktionsansatz , in dem enthalten ist: 

30 

- 1 ul genomische DNA (hergestellt wie oben beschrieben) 

- 0.25 mM dNTPs 

0.2 uM PR206 (SEQ ID No. 78) 
0.2 uM PR207 (SEQ ID No. 79) 
35 - 5 ul 10X PCR-Puffer (TAKARA) 

0.25 ul. R Taq Polymerase (TAKARA) 
28.8 ul. Aq. Dest. 

Die PCR-Amplif ikation mit SEQ ID No. 78 und SEQ ID No. 79 resul- 
40 tiert in einem 307 bp Fragment (SEQ ID No. 80) das fur den LB— 
Terminator enthaelt. Unter Verwendung von Standardmethoden wurde 
das Amplif ikat in den PCR-Klonierungsvektor pCR 2.1 (Invitrogen) 
kloniert und der Klon pLB3 erhalten. Sequenzierung des Klons pL»B3 
mit dem M13F- und dem M13R-Primer bestatigte eine Sequenz, welche 
45 mit der DNA-Sequenz von 3-298 des Datenbank-eintrages AX696005 
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identisch ist. Dieser Klon heisst pLB3 und wird daher fur die 
Klonierung in den Vektor pJAP3P (siehe Beispiel 5) verwendet. 

Die Expressionskassette pJAP3P wurde modifiziert/ indent der 35S- 
5 Terminator durch den Legumin LB3 -Terminator des Vicia faba (Da- 
tenbankeintrag AX696005; WO03/008596) ersetzt wurde (siehe un- 
ten) . 

Fur die Herstellung der &-Hydr6xylase-Sequenz wird Total-RNA aus 

10 Tomate prapariert. Dazu werden lOOmg der gefrorenen, pulverisier- 
ten Bltiten in ein Reaktionsgef a£ \iberfuhrt und in 0.8 ml Trizol- 
Puffer (Lif eTechnologies) aufgenommen. Die Suspension wird mit 
0.2 ml Chloroform extrahiert. Nach 15 minutiger Zentrifugation 
bei 12 000 g wird der wSssrige Uberstand abgenommen und in ein 

15 neues Reaktionsgef afi tiberffthrt und mit einem Volumen Ethanol ex- 
trahiert. Die RNA wird mit einem Volumen Isopropanol gefallt, mit 
75% Ethanol gewaschen und das Pellet in DEPC Wasser (liber Nacht 
Inkubation von Wasser mit 1/1000 Volumen Diethylpyrocarbonat bei 
Raumtemperatur, anschlieSend autoklaviert) gelost. Die RNA— 

20 Konzentration wird photometrisch bestimmt. Fiir die cDNA-Synthese 
werden 2.5 ug Gesamt-RNA ftir 10 min bei 60 a C denaturiert, fur 2 
min auf Eis abgekuhlt und mittels eines cDNA— Kits (Ready-t6-go- 
you-prime-beads , Pharmacia Biotech) nach Herstellerangaben unter 
Verwendung eines antisense spezifischen Primers (PR215 SEQ ID No. 

25 56) in cDNA umgeschrieben . 

Die Bedingungen der anschliefienden PCR-Reaktionen sind die fol- 
genden : 

30 Die Nukleinsaure, kodierend die ^-Hydroxylase kodiert, wurde 
mittels "polymerase chain reaction " (PCR) aus Tomate unter 
Verwendung eines sense-spezif ischen Primers (VPR204, SEQ ID 
No. 81) und eines antisense-spezif ischen Primers (PR215 SEQ ID 
No. 82) amplif iziert . 

35 

Die PCR zur Amplif ikation der DNA, die fur ein ^-Hydroxylase Pro- 
tein bestehend aus der gesamten Primarsequenz kodiert, erfolgte 
in einem 50 ul Reaktionsansatz , in dem enthalten war: 

40 - 1 ul cDNA (hergestellt wie oben beschrieben) 
0.25 mM dNTPs 

0.2 uM VPR204 (SEQ ID No. 81) 
0.2 uM PR215 (SEQ ID No. 82) 
5 ul 10X PCR-Puffer (TAKARA) 
45 - 0.25 ul R Taq Polymerase (TAKARA) 
28 . 8 ul Aq. Dest . 
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Die PCR-Amplif ikation mit VPR204 und PR215 resultiert in einem 
1.040 bp Fragment (SEQ ID No. 83) das ftir die b-Hydroxylase co- 
diert. Das Amplifikat wird in den PCR-Klonierungsvektor pCR 2.1 
(Invitrogen) kloniert. Dieser Klon heisst pCrtR-b2 . 

5 

Seguenzierungen des Klons pCrtR-b2 mit den Primern M13-R und 
M13-R bestatigte eine Sequenz, welche mit der DNA-Sequenz von 
33-558 des Datenbank-eintrages BE354440 identisch ist und mit der 
DNA-Sequenz von 1-1009 des Datenbank-eintrages Y14810 identisch 
10 ist . Der Klon pCrtR-b2 wird daher fur die Klonierung in den Vek- 
tor pCSP02 verwendet (siehe unten) . 

Der erste Klonierungsschritt erfolgt durch Isolierung des 1.034 
bp Hindlll-EcoRI Fragmentes aus pCrtR-b2, abgeleitet vom Klonie- 
15 rungsvektor pCR-2 . 1 (Invitrogen), und Ligierung mit dem Hindlll- 
EcoRI geschnittenen Vektor pJAP3P (siehe Beispiel 5) . Der Klon, 
der das b-Hydroxylase-Fragment CrtR-b2 enthalt, heisst pCSP02. 

Der zweite Klonierungsschritt erfolgt durch Isolierung des 301bp 
20 EcoRI-XhoI Fragmentes aus pLB3 , abgeleitet vom Klonierungs vektor 
pCR~2.1 (Invitrogen), und Ligierung mit dem EcoRI-XhoI geschnit- 
tenen Vektor pCSP02 . Der Klon, der den 296 bp Terminator L&B ent- 
halt, heisst pCSP03 . Durch die Ligation entsteht eine transkrip- 
tionelle Fusion zwischen dem Terminator LB 3 lind dem b-Hydroxy- 
25 lase-Fragment CrtR-b2 . Zudem entsteht eine transkriptionelle Fu- 
sion zwischen dem AP3P Promoter und dem b-Hydroxylas e -Fragment . 

Beispiel 18: Herstellung einer Expressionskassette zur fruchtspe- 
zifischen Ueber express ion des B-Genes aus Lycopersicon esculen- 
30 turn. 

Die Expression des B-Genes aus Lycopersicon esculentum in Tomat 
(Lycopene b-cyclase; Datenbank-eintrages AF254793) erfolgt unter 
Kontrolle des f ruchtspezif ischen Promoters PDS (phytoene desatu- 
35 rase; Datenbank-eintrages U46919) aus Lycopersicon esculentum. 
Als Terminatorelement wird 35S aus CaMV verwendet. Die Sequenz 
des B-Genes wurde durch PCR aus genomischer DNA aus Lycopersicon 
esculentum hergestellt. 

40 Zur Isolation des B-Genes mittels PCR mit genomischer DNA von 
Lycopersicon esculentum wurden die Oligonukleotid Primer BGEN-1 
(SEQ ID No. 85) und BGEN-2 (SEQ ID No . 86) verwendet. 

Die genomische DNA wurde aus Lycopersicon esculentum wie be- 
45 schrieben (Galbiati M et al. Funct. Integr. Genomics 2000, 20 
1: 25-34) isoliert . 
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Die PCR Amplif ikation wurde wie folgt durchgefiihrt : 

80ng genomische DNA 
lx Expand Long Template PCR Puffer 
5 2,5 mM MgC12 

je 350 J-lM dATP, dCTP r dGTP, dTTp 
0.3 uM BGEN-1 (SEQ ID No. 85) 
0.3 uM BGEN-2 (SEQ ID No. 86) 
2 , 5 Units Expand Long Template Polymerase 
10 in einem Endvolumen von 25 jll 

Folgendes Temperaturprogramm wurde verwendet: 

1 Zyklus mit 120 sec bei 94°C 
15 35 Zyklen mit 94°C far 10 sec, 48°C fur 30 sec und 68°C ftir 3 min 
1 Zyklus mit 68°C fur 10 min 

Die PCR-Amplif ikation mit BGEN-1 und BGEN-2 resultiert in einem 
1.505 kb Fragment (SEQ ID No. 87) das fur die b-Hydroxylase co- 
20 diert. Das Amplif ikat wird in den PCR-Klonierungsvektor pCR-2 . 1 
(Invitrogen) kloniert. Dieser Klon heisst pBGEN. 

Sequenzierungen des Klons pBGEN mit den Primern M13-R und M13-F 
bestatigte eine Sequenz, welche mit der DNA-Sequenz von 1-1497 
25 des Datenbank-eintrages AF254793 identisch ist. Der Klon pCrtR- 
b2 wird daher flir die Klonierung in den Vektor pCSP02 verwendet 
(siehe unten) . 

Ftir die Herstellung der PDS-Promotor-Sequenz aus Lycopersxcon 
3 0 esculentum wird genomische DNA aus Lycopersicon escul en t um-Gewebe 
nach Standardise thoden isoliert und durch genomische PCR unter 
Verwendung der Primer PDS-1 und PDS-2 eingesetzt . Die PCR zur Am- 
plif ikation dieses PDS-PRomotor-Fragmentes , erfolgt in einem 50 
ul. Reaktionsansatz , in dem enthalten ist: 

35 

- 1 ul genomische DNA (hergestellt wie oben beschrieben) 
0.3 mM dNTPs 

0.2 uM PDS-1 (SEQ ID No. 89) 
0.2 uM PDS-2 (SEQ ID No. 90) 
40 — 5 ul 10X Pfu-Turbo Polymerase (Stratagene) 
1 ul Pfu-Turbo Polymerase (Stratagene) 
28.8 ul Aq. Dest. 

Folgendes Temperaturprogramm wurde verwendet : 

45 

1 Zyklus mit 120 sec bei 94°C 

36 Zyklen mit 94°C ftir 60 sec, 55°C fur 120 sec und 72°C fur 4 min 
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1 Zyklus mit 72°C ftir 10 min 

Die PCR-Amplif ikation mit PDS-1 und PDS-2 result iert in einem 
Fragment das die Sequenz fur den PDS-Promotor enthaelt . Das Am- 
5 plifikat wird in den pCR4-BLUNT (Invitrogen) kloniert. Dieser 
Klon heisst pPDS. 

Sequenzierungen mit den Primern M13-R und M13-F bestatigen eine 
zur Sequenz SEQ ID No. 91 identische Sequenz. Dieser Klon heisst 
10 pPDS und wird daher ftir die Klonierung in den Vektor pJBGEN 
verwendet (siehe unten) . 

Der erste Klonierungsschritt erfolgt durch Isolierung des 1.499 
bp NcoI/EcoRI Fragmentes aus pBGEN, abgeleitet vom Klonierungs- 

15 vektor pCR2 . 1 (Invitrogen). Zunaechst wird pBGEN mit BamHI ge- 
schnitten, die 3 % Enden nach Standardmethoden (30 min bei 30°C) 
aufgefuellt (Klenow-f ill-in) und dann ein Partialverdau mit Ncol 
durchgef uehrt, bei dem das entstehende 1.499 kb Fragment iso- 
liert. Anschliessend wurde dieses Fragment in den pCSP02 klo- 

20 niert, welches vorher mit EcoRI geschnitten, die 3'Enden nach 
Standardmethoden (30 min bei 3 0°C) aufgefuellt (Kl enow-fill-in) 
und dann wird mit Ncol geschnitten. Der Klon, der das 1.497 bp 
B-Gen-Fragment BGEN enthalt, heisst p JAP : BGEN . Durch die Liga- 
tion entsteht eine transkriptionelle Fusion zWischen dem 35S-Ter- 

25 minator und dem B-Gen. 

Der zweite Klonierungsschritt erfolgt durch Isolierung des 2.078 
bp PDS PROM Fragmentes aus pPDS. Zunaechst wird pPDS mit Smal 
geschnitten und dann ein Partialverdau mit SacI durchgef uehrt, 

30 bei dem das entstehende 2.088 bp Fragment isoliert. Anschlies- 
send wurde dieses Fragment in den pJAP:BGEN kloniert, welches 
vorher mit BamHI geschnitten, die 3' Enden nach Standardmethoden 
(30 min bei 30°C) aufgefuellt (Klenow-f ill-in) und dann wird mit 
SacI geschnitten. Durch die Ligation entsteht eine transkriptio- 

35 nelle Fusion zwischen dem Promotor PDS und dem B-Gen. Der Klon, 
der das 2.078 bp PDS Promotoren BGEN enthalt, heisst pJPDS:BGEN. 

Beispiel 19: Herstellung eines Dreif ach-Expressionsvektors zur 
Ueberexpression des B-Genes, der Expression der Nostoc puncti- 
40 forme Ketolase NP196, sowie der Ueberexpression der chromo- 
plastenspezif ischen B-Hydroxylase aus Lycoperslcon esculentum 
fruchtspezif isch in Lycoperslcon esculentum. 

Zunaechst erfolgt die Herstellung eines Doppelkonstruktes , das 
45 Expressionskassetten zur Ueberexpression der Nostoc punctiforme 
ATCC 29133 NP196 Ketolase sowie zur Ueberexpression der B-Hydro- 
xylase enthaelt. Zunaechst wird dem Fragment AP3P : b-Hydroxy- 
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lase:LB3, das die B-Hydroxylase-Expressionskassette enthaelt, als 
2104 bp Ecll36II~XhoI Fragment isoliert aus pCSP03 (in Beispiel 
18 beschrieben). Das Auffxillen der 3 N Enden (30 min bei 30 a C) er- 
folgt nach Standardmethoden (Klenow-f ill-in) . Anschliessend, 
5 wurde dieses Fragment in der Vektor MSP120 (in Beispiel 10 be- 
schrieben) xnit Ecll36ll und EcoRI geschnitten, die 3 % Enden nach 
Standardmethoden (30 min bei 30°C) aufgefuellt (Klenow-f ill-in) . 
Durch die Ligation entsteht eine T-DNA die zwei Expressionskas- 
setten enthaelt: erstens eine Kassette zur chromoplastenspezif i- 

10 schen Ueberexpression der B-Hydroxylase aus Lycoperslcon esculen- 
turn, und zweitens eine Kassette zur Ueberexpression der Ketolase 
NP196 aus Nostoc punctiforme. Die B-Hydroxylase-Runterregulie- 
rungs-Kassette kann in zwei Orientierungen in den Vektor ligie- 
ren. Bevorzugt wird die Version verwendet, in der beide Expres- 

15 sionskassette in ihrer Orient ierung uebereinstimmen (siehe Abbil- 
dung 14) . Diese Version kann durch PCR wie beschrieben identifi- 
ziert werden: 

Die PCR zur Amplif ikation des PR206-PR010 Plasmid-Fragmentes, das 
20 die Verbindung von LB3 terminator der B-Hydroxylase-Kassette und 
des AP3P-Promoters der Ketolase-Kassette enthaelt, erfolgt in 
einem 50 ul Reaktionsansatz, in dem enthalten ist: ' 

1 ul Plasmid-DNA (nach Standardmethoden hfergestellt) 
25 - 0.25 mM dNTPs 

0.2 uM PR010 (SEQ ID No. 92) 

0.2 uM PR206 (SEQ ID No. 93) 

5 ul 10X PCR-Puffer (TAKARA) 

0.25 ul. R Taq Polymerase (TAKARA) 
30 - 28.8 ul. Aq. Dest . 

Die PCR-Amplif ikation mit PR010 und PR206 resultiert in einem. 
1.080 Bp Fragment, das auf das Vorliegen der oben beschriebenen 
Verbindung von LB3 -Terminator und AP3P-Promotor hinweist, und da- 
35 mit die bevorzugte Orientierung beider Expressionskassetten. Die- 
ser Klon heisst pBHYX:NP196. 

Zur Klonierung dieser B-Gen-Ueberexpressionskassette in Expres- 
sionsvektoren fur die Agrobacterium-vermittelte Transformation 

40 von Tomate erfolgt durch Isolierung des 4.362 Bp EcoRV-XhoI Frag- 
mentes aus pJPDS:BGEN (siehe Beispiel 19) und Ligierung in dem 
Smal-XhoI-geschnittenen Vektor pBHYX:NP196 (oben beschrieben) . 
Durch die Ligation entsteht eine T-DNA die drei Expressionskas- 
setten enthaelt: erstens eine Kassette zur Ueberexpression des B- 

45 Genes , zweitens eine Kassette zur Ueberexpression der Ketolase 
NP196-1 aus Nostoc puncti forme, und drittens eine Kassette zur 
chromoplastenspezif ischen Ueberexpression der B-Hydroxylase aus 
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Lycopersicon esculentum (Abbildung 14, Konstruktkarte) . Dieser 
Klon heisst MSP124. In der Abbildung 14 beinhaltet Fragment AP3P 
PROM (765 bp) den AP3P-Promoter , das Fragment BHYX b2 CDS (2 bp) 
die B-Hydroxylase CrtRb2, Fragment LB3 TERN (296 bp) den LB3 Ter- 
5 minator . 

Weiterhin beinhaltet Fragment AP3P PROM (765 bp) den AP3P~Promo- 
ter, Fragment rhcS TP FRAGMENT (194 bp) das Transitpeptid des 
rbcS Gens aus Erbse, NP196 KETO CDS (761 bp) die Ketolase aus No- 
10 stoc punctifoxwe ATCC29133, und OCS TERM (192 bp) das Polyadeny- 
lierungssignal des Octopin-Synthasegens . 

Weiterhin beinhaltet Fragment PDS PROM (2078 bp) den PDS Promo- 
ter, Fragment BGEN CDS (1.497 bp) die B-Gen Sequenz, und Fragment 
15 35S TERM (746 bp) den 35S Terminator. 

Beispiel 20: 

Herstellung transgener Lycopersicon esculentum Pflanzen 

20 

Transformation und Regeneration von Tomatenpf lanzen wurde in Bei- 
spiel 6 beschrieben. * 

GemaS der beschriebenen Trans format ionsmethod^ wurden mit folgen- 
25 den Expressionskonstrukten folgende Linien erhalten: 

Mit MSP120 wurde erhalten: MSP120-1, MSP120-2, MSP120-3 

Mit MSP121 wurde erhalten: MSP121-1, MSP121-2, MSP121-3 

30 

Mit MSP122 wurde erhalten: MSP122-1, MSP122-2, MSP122-3 

Mit MSP123 wurde erhalten: MSP123-1, MSP123-2, MSP123-3 

35 Mit MSP124 wurde erhalten: MSP124-1, MSP124-2, MSP124-3 



40 
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Patentanspruche 

1. Verfahren zur Herstellung von Ketocarotinoiden durch Kulti- 
5 vierung von genetisch veranderten Pflanzen, die in Fruchten 

eine Ketolase-Aktivitat aufweisen. 

2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass man 
genetisch veranderte Pflanzen verwendet, die in Fruchten eine 

10 Ketolase exprimieren. 

3. Verfahren nach Anspruch 1 oder 2, dadurch gekennzeichnet, 
dass man genetisch veranderte Pflanzen verwendet, die in 
Fruchten mindestens eine Nukleins&ure, kodierend eine Keto- 

15 lase, enthalten. 

4. Verfahren nach Anspruch 3, dadurch gekennzeichnet, dass man 
genetisch veranderte Pflanzen verwendet , in die man ausgehend 
von einer Ausgangspf lanze mindestens eine Nukleinsaure, 

20 kodierend eine Ketolase, eingebracht hat. 

5. Verfahren nach Anspruch 4, dadurch gekennzeichnet, das£ man 
Nukleinsauren eihbringt, die ein Protein kodieren, enthaltend 
die Aminosauresequenz SEQ ID NO. 2 oder eine von dieser 

25 Sequenz durch Substitution, Insertion oder Deletion von Ami- 

nosauren abgeleitete Sequenz, die eine Identitat von minde- 
stens 20% auf Aminosaureebene mit der Sequenz SEQ ID NO. 2 
und die enzymatische Eigenschaft einer Ketolase aufweist. 

30 6. Verfahren nach Anspruch 4, dadurch gekennzeichnet, dass man 

Nukleinsauren, enthaltend die Sequenz SEQ ID NO. 1 einbringt. 

7. Verfahren nach Anspruch 4, dadurch gekennzeichnet, dass man 
Nukleinsauren einbringt die ein Protein kodieren, enthaltend 
35 die Aminosauresequenz SEQ ID NO. 16 oder eine von dieser 

Sequenz durch Substitution, Insertion oder Deletion von Ami- 
nosauren abgeleitete Sequenz, die eine Identitat von minde- 
stens 20% auf Aminosaureebene mit der Sequenz SEQ ID NO. 16 
und die enzymatische Eigenschaft einer Ketolase aufweist. 



40 



Verfahren nach Anspruch 6, dadurch gekennzeichnet, dass man 
Nukleinsauren, enthaltend die Sequenz SEQ ID NO. 15 ein- 
bringt . 



45 



Sequ. + Zeichn. 
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9 . Verf ahren nach einem der Anspriiche 1 bis 8 , dadurch gekenn- 
zeichnet, dass man genetisch veranderte Pflanzen verwendet, 
die in Frttchten die hochste Expressionsrate einer Ketolase 
aufweisen. 

10. Verf ahren nach Anspruch 9, dadurch gekennzeichnet , dass die 
Genexpression der Ketolase unter Kontrolle eines fruchtspezi- 
fischen Promotors erfolgt. 

11. Verf ahren nach einem der Anspriiche 1 bis 10, dadurch gekenn- 
zeichnet, dass die Pflanzen zus&tzlich gegenuber dem Wildtyp 
eine erhohte Aktivitat mindestens einer der Aktivit&ten, aus- 
gewahlt aus der Gruppe Hydroxylase-Aktivitat und S-Cyclase- 
Aktivitat aufweisen. 

12. Verf ahren nach Anspruch 11, dadurch gekennzeichnet, dass man 
zur zusatzlichen Erhohung mindestens einer der Aktivitaten, 
die Genexpression mindestens einer Nukleinsaure ausgew&hlt 
aus der Gruppe, Nukleinsauren kodierend eine Hydroxylase und 
Nukleinsauren kodierend eine ^-Cyclase gegenxiber dem Wildtyp 
erheht . 

13. Verf ahren nach Anspruch 12, dadurch gekennzeichnet, dass man 
zur Erhohung der Genexpression mindestens* einer der Nuklein- 
sauren, mindestens eine Nukleinsaure ausgew^hlt aus der 
Gruppe, Nukleinsauren kodierend eine Hydroxylase und Nuklein- 
sauren kodierend eine ^-Cyclase in die Pflanze einbringt. 

14. Verf ahren nach Anspruch 13, dadurch gekennzeichnet, dass man 
als Nukleinsaure kodierend eine Hydroxylase, Nukleinsauren 
einbringt die eine Hydroxylase kodieren, enthaltend die 
Aminos auresequenz SEQ ID NO: 52 oder eine von dieser Sequenz 
durch Substitution, Insertion oder Deletion von Aminos&uren 
abgeleitete Sequenz, die eine Identitat von mindestens 20 % 
auf Aminos &ureebene mit der Sequenz SEQ ID NO: 52 aufweist. 

15. Verf ahren nach Anspruch 14, dadurch gekennzeichnet, dass 
man Nukleinsauren, enthaltend die Sequenz SEQ ID NO: 51 ein- 
bringt . 

16. Verf ahren nach Anspruch 13, dadurch gekennzeichnet, dass man 
als Nukleinsaure kodierend eine S-Cyclase, Nukleinsauren ein- 
bringt die eine S-Cyclase kodieren, enthaltend die Amino- 
sauresequenz SEQ ID NO: 54 oder eine von dieser Sequenz durch 
Substitution, Insertion oder Deletion von Aminosauren abge- 
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leitete Sequenz, die eine Identity von mindestens 20 % auf 
Aminosaureebene mit der Sequenz SEQ ID NO: 54 aufweist. 

17 verfahren nach Anspruch 16, dadurch gekennzeichnet , dass 

' xoan Nukleinsauren, enthaltend die Sequenz SEQ ID NO: 53 exn- 
bringt . 

18 Verfahren nach einem der Anspriiche 11 bis 17 , dadurch gekenn- 
" zeichnet, dass man genetisch veranderte Pflanzen verwendet, 

die in Bliiten die h6chste Expressionsrate einer Hydroxylase 
und/oder S-Cyclase aufweisen. 

19 verfahren nach Anspruch 18, dadurch gekennzeichnet, dass 

' die Genexpression der Hydroxylase und/oder S-Cyclase unter 
Kontrolle eines bliltenspezif ischen Promoters erf olgt . 

20 Verfahren nach einem der Anspruche 1 bis 10, dadurch gekenn- 
' zeichnet, dass man als Pflanze eine Pflanze verwendet, die 

in Friichten Chromoplasten aufweist. 

21 Verfahren nach einem der Anspruche 1 bis 20, dadurch gekenn- 
zeichnet, dass man als Pflanze eine Pflanze ausgewahlf aus 
den Pflanzengattungen Actinophloeus , Aglaeonema, Ananas, 
Arbutus, Archontophoenix, Area, Aronia, Asparagus, Attalea, 
Berberis, Bixia, Brachychilum, Bryonia, Caliptocalix, 
Capsicum, Carica, Celastrus, Citrullus, Citrus, Convallana, 
Cotoneaster, Crataegus, Cucumis, Cucurbita, Cuscuta, Cycas, 
Cyphomandra, Dioscorea, Diospyrus, Dura, Elaeagnus, Elaeis, 
Erythroxylon, Euonymus, Ficus, Fortunella, Fragana, Gardx- 
nia, Gonocaryum, Gossypium, Guava, Guilielma, Hibiscus, 
Hippophaea, Iris, Lathyrus, Lonicera, Luff a, Lycium, 
Lycopersicum, Malpighia, Mangifera. Mormodica, Murraya. Musa, 
Nenga, Palisota, Pandanus, Passiflora, Persea, ^ sal "' 
Prunus, Ptychandra, Punica, Pyracantha, Pyrus, Ribes, Rosa, 
Rubus, Sabal, Sambucus, Seaforita, Shepherdia, Solanum 
Sorbus, Synaspadix, Tabemae, Tamus, Taxus, Trichosanthes 
Triphasia, Vaccinium, Viburnum, Vignia oder Vitis verwendet. 

22 Verfahren nach einem der Anspriiche 1 bis 21, dadurch gekenn- 
" zeichnet, dass man nach dem Kultivieren die genetisch veran- 
derten Pflanzen erntet und anschlieSend die Ketocarotinoide 
aus den Friichten der Pflanzen isoliert. 
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23. Verfahren nach einem der Anspruche 1 bis 22, dadurch gekenn- 
zeichnet, dass die Ketocarotinoide ausgewahlt sind aus der 
Gruppe Astaxanthin, Canthaxanthin, Echinenon, 3-Hydroxye- 
chinenon, 3 ' -Hydr oxyechinenon , Adonirubin und Adonixanthin. 

5 

24. Nukleinsaurekonstrukt , enthaltend funktionell verkniipft einen 
fruchtspezif ischerx Promotor und eine Nukleinsaure kodierend 
eine Ketolase. 



10 25. Genetisch veranderte Pflanze, die in Friichten eine Ketolase- 
Aktivitat aufweist. 



26. Genetisch veranderte Pflanze nach Anspruch 25, dadurch 
gekennzeichnet, dass die genetisch veranderte Pflanze in 

15 den Friichten eine Ketolase exprimiert. 

27. Genetisch veranderte Pflanze nach Anspruch 25 oder 26, ent- 
haltend in Frachten mindestens eine Nukleinsaure, kodierend 
eine Ketolase. 

20 

28. Genetisch veranderte Pflanze nach einem der Anspriiche 25 bis 

27, dadurch gekennzeichnet dass man in die Pflanze ausgehend 
von einer Ausgangspf lanze mindestens eine Nukleinsaure, 
kodierend eine Ketolase, eingebracht hat. 

25 

29. Genetisch veranderte Pflanze nach einem der Anspruche 25 bis 

28, dadurch gekennzeichnet, dass die genetische Veranderung 
zus&tzlich mindestens eine der Aktivitaten, ausgewahlt aus 
der Gruppe Hydroxlase-Aktivitat und £-Cyclase-Aktivitat ge- 

30 geniiber einer Wildtyppf lanze erhoht. 

30. Genetisch veranderte Pflanze, ausgewahlt aus den Pflanzen- 
gattungen Actinophloeus , Aglaeonema, Ananas, Arbutus, Archon- 
tophoenix, Area, Aronia, Asparagus, Attalea, Berber is, Bixia, 

35 Brachychilum, Bryonia, Caliptocalix, Capsicum, Carica, Celas- 

trus, Citrullus, Citrus, Convallaria, Cotoneaster, Crataegus, 
Cucumis, Cucurbita, Cuscuta, Cycas, Cyphomandra, Dioscorea, 
Diospyrus, Dura, Elaeagnus, Elaeis, Erythroxylon, Euonymus, 
Ficus, Fortunella, Fragaria, Gardinia, Gonocaryum, Gossypium, 

40 Guava, Guilielma, Hibiscus, Hippophaea, Iris, Lathyrus, Loni- 

cera, Luffa, Lycium, Lycopersicum, Malpighia, Mangif era , * Mor- 
modica, Murraya, Musa, Nenga, Palisota, Pandanus, Passiflora, 
Persea, Physalis, Prunus, Ptychandra, Punica, Pyracantha, 
Pyrus, Ribes, Rosa, Rubus, Sabal, Sambucus, Seaforita, 

45 Shepherdia, Solanum, Sorbus, Synaspadix, Tabernae, Tamus, 

Taxus, Trichosanthes, Triphasia, Vaccinium, Viburnum, Vignia 
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31. 



67 

Oder Vitis, enthal tend mindes tens eine Nukleinsaure, kodie- 
rend eine Ketolase. 

Genet isch veranderte Pflanze nach Anspruch 30, dadurch 
•gekennzeichnet, dass die Ketolase in Fruchten expnmxert 
wird. 

^2 Genetisch veranderte Pflanze nach einem der Anspruche 25 bis 
" 31, dadurch gekennzeichnet, dass die Express ionsrate exner 
Ketolase in Fruchten am hochsten ist. 



10 

33. 

15 34 



20 35 



25 



30 



35 



Verwendung der genetisch veranderten Pflanzen nach einem 
der Anspruche 25 bis 32 als Futter- oder Nahrungsmxttel . 

Verwendung der Fruchte der genetisch veranderten ^ anzen 
nach einem der Anspruche 25 bis 32 zur Herstellung von Keto- 
carotinoid-haltigen Extrakten oder zur Herstellung von Fut- 
ter- oder Nahrungserganzungsmittel . 

Verfahren zur Herstellung von genetisch veranderten Pflanzen 
gemafc Anspruch 32, dadurch gekennzeichnet, dass man exn 
Nukleinsaurekonstrukt, enthaltend funktionell verkxxupft exnen 
fruchtspezifischen Promoter und Nukleinsauren kodxerend 
eine Ketolase in das Genom der Ausgangspf lanze einfuhrt. 



40 



45 
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Verfahren zur Herstellung von Ketocarotinoiden in Friichten von 
Pflanzen 

5 Zusammenf assung 

Die Erfindung betrifft ein Verfahren zur Herstellung von Ketoc< 
rotinoiden durch Kultivierung von genetisch ver^nderten Pf lanz« 
die in FrUchten eine Ketolase-Aktivitat aufweisen. 



15 



20 

s 



25 



30 



35 



40 



45 
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Abbildung 1: Biosyntheseschema von Carotinoiden in Tomatenf rticl 



Isoprenoide | ' J > Phytoen 



Lycopin 

E "~ Cyclase ^ 

^/S^ 3- Cyclase/3 

& -Cyclase 




a -Carotin fl -Carotin 

Lutein Zeaxanthin 
Violaxanthin 
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Abbildung 2: Biosyntheseschema von Astaxanthin in genetisch 
veranderten Tomatenf ruechten 



Isoprenoide 1 y Phytoen 
Lycopin 



t-Cyc)ase 
\\-Cyctase 



a -Carotin 
Lutein 



fi-Cycfase 




Ketolase 

p -Carotin jT~^ Canthaxanthin 
Zeaxanthin Astaxanthin 

.a 

Vioiaxanthin 
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Abbildung 3: Nukleotidsequenzvergleich 



KET02.seq ATODOT/rattG^^^ 
X86782.seq ATOQ^/CXXTGACAGrMTC^ 



KET02.seq 
XS6782.scq 

KETO2.scq 
X86782.seq 

KETO2.seq 
X86782.seq 

KET02.seq 
XS6782.seq 

KET02.scq 
X86782.seq 

KET02.seq 
X86782.seq 

KET02.scq 
X86782.seq 

KET02.seq 
X86782.seq 

KET02.seq 
X86782.seq 



cAToacAATOenrr^^ 
CATC/cwarxrr/iccniGir 



CTocmjroro^Tax^^ 

CTOCOCGTGTt^T(XC/OOar/<r^ 

TrmATC^/^xrAKKryrTAT^ 

TTTTTATC/£tI/£TX'ATO 

Grno\TT/cvcATcrTcr/ccx^ 



TOoccAAanrrTOGTGrTCAToa 



ccccnrAcrrrcTrcv^c^ 



c/oacAa^cAaa:iuxccniaxcc^ 



PP 53863 



4/14 



Abbildung 4 : Proteinseguenzvergleich 
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KET02.pro 
X867S2.pro 


R Q 
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KET02.pro 
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X86782.pro 
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KET02.pro 
X86782.pro 
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D V L R T WA T Q Y S 



DTKGI 
DTKGI 



T MA L A V 1 
T M A L R V I 



GSWAAVFLHAI 
GSWAAVFLHAI 



F Q 
F Q 



KLPTSLC 
KLPTSLC 



S S L L H I 
S S L L D I 



VVVFFVLEFLYTGLFI 
VVVF FVLEFLYTGLF I 



TTHDAMHGTl 
TTHDAMHGT! 



LYAWF DYNMLHRKHWEHHNHTGEVGKDP DF HR 
LYAWF DYNMLHRKHWEHHNHTGEVGKDP DFHR 



L G A P MA N L L 
LGAPMANLL 
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F L T C Y 
F L T C Y 
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Abbildung 5: Konstrukt zur ttberexpression des p-C-4-Oxygenase 
Proteins aus H. pluvialls mit rbcS Trans itpeptic 
aus Erbse unter Kontrolle des d3 5S-Promoters (Tc 
matentransf ormationskonstrukt) 



EcoRI.SacI 
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Abbildung 6: Konstrukt zur Uberexpression des N-terminal verkur 
ten Ketolase ((5-C-4-Oxygenase) Proteins aus H. pluvialls mit rb 
Transitpeptid aus Erbse unter Kontrolle des d3 5S-Promoters . 



EcoRI.Sacl 




9 
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Abbildung 8: Konstrukt zur Uberexpression der |3-C-4-Oxygenas€ 
Protein aus H. pluvialis mit rbcS Transitpeptide 
aus Erbse unter Kontrolle des AP3P- Promoters (Tc 
matentransf ormationskonstrukt ) „ 
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Abbildung 9: Konstrukt zur Uberexpression des Ketolase ((3-C-4-Ox 
genase) Proteins aus H. pluvialis mit rbcS Transitpeptid aus 
Erbse und Oterminalem myc-Tag unter Kontrolle des AP3P-Promo- 
ters . 
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SEQUENCE LISTING 
<110> SunGene GmbH Co. KGaA 

<120> Verfahren zur herstellung von Astaxanthin in Fruechten von Pflanzen 
<130> NAE 365/02 
<160> 93 

<170> Patentin version 3.1 

s 

<210> 1 
<211> 1771 
<212> DNA 

<213> Haematococcus pluvialis 
<220> 

<221> CDS 

<222> (166) . . (1155) 

<223> 



<40 0> 1 

ggcacgagct tgcacgcaag tcagcgcgcg caagtcaaca cctgccggtc cacagcctca 60 

aataataaag agctcaagcg tttgtgcgcc tcgacgtggc cagtctgcac tgccttgaac 120 

ccgcgagtct cccgccgcac tgactgccat agcacagcta gacga atg cag eta gca 177 
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Met Gin Leu Ala 
1 

gcg aca gta atg ttg gag cag ctt acc gga age get gag gca etc aag 225 
5 Ala Thr Val Met Leu Glu Gin Leu Thr Gly Ser Ala Glu Ala Leu Lys 
5 10 15 20 

gag aag gag aag gag gtt gca ggc age tct gac gtg ttg cgt aca tgg 273 
Glu Lys Glu Lys Glu Val Ala Gly Ser Ser Asp Val Leu Arg Thr Trp 
10 25 30 35 

gcg acc cag tac teg ctt ccg tea gaa gag tea gac gcg gec cgc ccg 321 
Ala Thr Gin Tyr Ser Leu Pro Ser Glu Glu Ser Asp Ala Ala Arg Pro 
40 45 50 

15 

gga ctg aag aat gee tac aag cca cca cct tec gac aca aag ggc ate 369 
Gly Leu Lys Asn Ala Tyr Lys Pro Pro Pro Ser Asp Thr Lys Gly He 
55 60 65 

20 aca atg gcg eta cgt gtc ate ggc tec tgg gee gca gtg ttc etc cac 417 
Thr Met Ala Leu Arg Val He Gly Ser Trp Ala Ala Val Phe Leu His 
70 75 80 

gee att ttt caa ate aag ctt ccg acc tec ttg gac cag ctg cac tgg 
25 Ala He Phe Gin He Lys Leu Pro Thr Ser Leu Asp Gin Leu His Trp 
85 90 95 100 

. i 

ctg ccc gtg tea gat gec aca get cag ctg gtt age ggc acg age age 
Leu Pro Val Ser Asp Ala Thr Ala Gin Leu Val Ser Gly Thr Ser Ser 
30 105 110 115 

ctg etc gac ate gtc gta gta ttc ttt gtc ctg gag ttc ctg tac aca 561 
Leu Leu Asp He Val Val Val Phe Phe Val Leu Glu Phe Leu Tyr Thr 
120 125 130 

35 

ggc ctt ttt ate acc acg cat gat get atg cat ggc acc ate gec atg 
Gly Leu Phe He Thr Thr His Asp Ala Met His Gly Thr He Ala Met 
135 140 145 

40 aga aac agg cag ctt aat gac ttc ttg ggc aga gta tgc ate tec ttg 657 
Arg Asn Arg Gin Leu Asn Asp Phe Leu Gly Arg Val Cys He Ser Leu 
150 155 160 



tac gec tgg ttt gat tac aac atg ctg cac cgc aag cat tgg gag cac 
45 Tyr Ala Trp Phe Asp Tyr Asn Met Leu His Arg Lys His Trp Glu His 
165 170 175 180 

cac aac cac act ggc gag gtg ggc aag gac cct gac ttc cac agg gga 
His Asn His Thr Gly Glu Val Gly Lys Asp Pro Asp Phe His Arg Gly 
50 185 190 195 



465 



513 



609 



705 



753 
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aac cct ggc att gtg ccc tgg ttt gcc age ttc atg tec age tac atg 
Asn Pro Gly He Val Pro Trp Phe Ala Ser Phe Met Ser Ser Tyr Met 
200 205 210 

5 

teg atg tgg cag ttt gcg cgc etc gca tgg tgg acg gtg gtc atg cag 
Ser Met Trp Gin Phe Ala Arg Leu Ala Trp Trp Thr Val Val Met Gin 
215 220 225 

10 ctg ctg ggt gcg cca atg gcg aac ctg ctg gtg ttc atg gcg gcc gcg 
Leu Leu Gly Ala Pro Met Ala Asn Leu Leu Val Phe Met Ala Ala Ala 
230 235 240 

ccc ate ctg tec gcc ttc cgc ttg ttc tac ttt ggc acg tac atg ccc 
15 Pro He Leu Ser Ala Phe Arg Leu Phe Tyr Phe Gly Thr Tyr Met Pro 
245 250 255 260 

cac aag cct gag cct ggc gcc gcg tea ggc tct tea cca gcc gtc atg 
His Lys Pro Glu Pro Gly Ala Ala Ser Gly Ser Ser Pro Ala Val Met 
20 265 270 275 

aac tgg tgg aag teg cgc act age cag gcg tec gac ctg gtc age ttt 
Asn Trp Trp Lys Ser Arg Thr Ser Gin Ala Ser Asp Leu Val Ser Phe 
280 285 290 

25 

ctg ace tgc tac cac ttc gac ctg cac tgg gag cac cac cgc tgg ccc 
Leu Thr Cys Tyr His Phe Asp Leu His Trp Glu His His, Arg Trp Pro 
295 300 305 

30 ttc gcc ccc tgg tgg gag ctg ccc aac tgc cgc cgc ctg tct ggc cga 
Phe Ala Pro Trp Trp Glu Leu Pro Asn Cys Arg Arg Leu Ser Gly Arg 
310 315 320 

ggt ctg gtt cct gcc tag ctggacacac tgcagtgggc cctgctgcca 
35 Gly Leu Val Pro Ala 
325 

gctgggcatg caggttgtgg caggactggg tgaggtgaaa agetgeagge gctgctgccg 1245 

40 gacacgctgc atgggctacc ctgtgtagct gccgccacta ggggaggggg tttgtagctg 1305 

tegagcttge cccatggatg aagctgtgta gtggtgcagg gagtacaccc acaggccaac 1365 

acccttgcag gagatgtctt gegtegggag gagtgttggg cagtgtagat gctatgattg 142 5 

tatcttaatg ctgaagcett taggggagcg acacttagtg ctgggcaggc aacgccctgc 1485 

aaggtgcagg cacaagctag gctggacgag gactcggtgg caggcaggtg aagaggtgcg 1545 

50 ggagggtggt gccacaccca ctgggcaaga ccatgctgca atgctggcgg tgtggcagtg 160 5 



45 



801 



849 



897 



945 



993 



1041 



1089 



1137 



1185 
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4 

agagctgcgt gattaactgg gctatggatt gtttgagcag tctcacttat tctttgatat 1665 
agatactggt caggcaggtc aggagagtga gtatgaacaa gttgagaggt ggtgcgctgc 1725 

5 

1771 

ccctgcgctt atgaagctgt aacaataaag tggttcaaaa aaaaaa 
<210> 2 

10 

<211> 329 
<212> PRT 
15 <213> Haematococcus pluvialis 



<400> 2 

20 

Met Gin Leu Ala Ala Thr Val Met Leu Glu Gin Leu Thr Gly Ser Ala 
15 10 15 



25 Glu Ala Leu Lys Glu Lys Glu Lys Glu Val Ala Gly Ser Ser Asp Val ' 
20 25 30 



Leu Arg Thr Trp Ala Thr Gin Tyr Ser Leu Pro Ser Glu Glu Ser Asp 
30 35 40 45 



Ala Ala Arg Pro Gly Leu Lys Asn Ala Tyr Lys Pro Pro Pro Ser Asp 
50 55 60 

35 

Thr Lys Gly lie Thr Met Ala Leu Arg Val lie Gly Ser Trp Ala Ala 
65 * 70 75 80 

40 

Val Phe Leu His Ala lie Phe Gin lie Lys Leu Pro Thr Ser Leu Asp 
85 90 95 



45 Gin Leu His Trp Leu Pro Val Ser Asp Ala Thr Ala Gin Leu Val Ser 
100 105 110 



Gly Thr Ser Ser Leu Leu Asp lie Val Val Val Phe Phe Val Leu 
50 115 120 125 
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Phe Leu Tyr Thr Gly Leu Phe lie Thr Thr His Asp Ala Met His Gly 
130 135 14° 

5 

Thr He Ala Met Arg Asn Arg Gin Leu Asn Asp Phe Leu Gly Arg Val 
145 150 1S5 160 

10 

cys He Ser Leu Tyr Ala Trp Phe Asp Tyr Asn Met Leu His Arg Lys 
165 170 17S 



15 His Trp Glu His His Asn His Thr Gly Glu Val Gly Lys Asp Pro Asp 
180 185 19° 

Phe His Arg Gly Asn Pro Gly He Val Pro Trp Phe Ala Ser Phe Met 
20 195 200 205 



Ser Ser Tyr Met Ser Met Trp Gin Phe Ala Arg Leu Ala Trp Trp Thr 
210 215 220 

25 

Val val Met Gin Leu Leu Gly Ala Pro Met Ala Asn Leu-Leu Val Phe 
225 230 235 240 

30 

Met Ala Ala Ala Pro He Leu Ser Ala Phe Arg Leu Phe Tyr Phe Gly 
245 • 250 255 



35 Thr Tyr Met Pro His Lys Pro Glu Pro Gly Ala Ala Ser Gly Ser Ser 
260 265 270 



Pro Ala Val Met Asn 



Trp Trp Lys Ser Arg Thr Ser Gin Ala Ser Asp 



40. 275 280 285 



Leu Val Ser Phe Leu Thr Cys Tyr His Phe Asp Leu His Trp Glu His 
290 295 30° 

45 

His Arg Trp Pro Phe Ala Pro Trp Trp Glu Leu Pro Asn Cys Arg Arg 
305 310 315 320 



50 



6 

Leu Ser Gly Arg Gly Leu Val Pro Ala 
325 



5 <210> 3 

<211> 1662 

<212> DNA 

10 

<213> Haematococcus pluvialis 



15 <220> 

<221> CDS 

<222> (168) . . (1130) 
<223> 



20 



25 <400> 3 r 
cggggcaact caagaaattc aacagctgca agcgcgcccc agcctcacag cgccaagtga 

gctatcgacg tggttgtgag cgctcgacgt ggtccactga cgggcctgtg agcctctgcg 

30 ctccgtcctc tgccaaatct cgcgtcgggg cctgcctaag tcgaaga atg cac gtc 

Met His Val 

1 

gca teg gca eta atg gtc gag cag aaa ggc agt gag gca get get tec 
35 Ala Ser Ala Leu Met Val Glu Gin Lys Gly Ser Glu Ala Ala Ala Ser 
5 10 15 

age cca gac gtc ttg aga gcg tgg gcg aca eag tat cac atg cca tec 
Ser Pro Asp Val Leu Arg Ala Trp Ala Thr Gin Tyr His Met Pro Ser 
40 20 25 30 35 

gag teg tea gac gca get cgt cct gcg eta aag cac gcc tac aaa cct 
Glu Ser Ser Asp Ala Ala Arg Pro Ala Leu Lys His Ala Tyr Lys Pro 



45 



40 45 50 

cca gca tct gac gcc aag ggc ate acg atg gcg ctg acc ate att ggc 
Pro Ala Ser Asp Ala Lys Gly He Thr Met Ala Leu Thr He He Gly 
55 60 65 



50 acc tgg acc gca gtg ttt tta cac gca ata ttt caa ate agg eta ccg 



60 
120 
17 6 

224 

272 

320 

368 

416 



rr wouu 



15 



35 



464 



7 

Thr Trp Thr Ala Val Phe Leu His Ala lie Phe Gin He Arg Leu Pro 
70 75 80 

aca tec atg gac cag ctt cac tgg ttg cct gtg tec gaa gec aca gec 
5 Thr Ser Met Asp Gin Leu His Trp Leu Pro Val Ser Glu Ala Thr Ala 
85 90 95 

cag ctt ttg ggc gga age age age eta ctg cac ate get gca gtc ttc 512 
Gin Leu Leu Gly Gly Ser Ser Ser Leu Leu His He Ala Ala Val Phe 
10 100 105 110 H5 

att gta ctt gag ttc ctg tac act ggt eta ttc ate acc aca cat gac 560 
He Val Leu Glu Phe Leu Tyr Thr Gly Leu Phe He Thr Thr His Asp 
120 125 130 

gca atg cat ggc acc ata get ttg agg cac agg cag etc aat gat etc 608 
Ala Met His Gly Thr He Ala Leu Arg His Arg Gin Leu Asn Asp Leu 
135 140 145 

20 ctt ggc aac ate tgc ata tea ctg tac gec tgg ttt gac tac age atg 656 
Leu Gly Asn He Cys He Ser Leu Tyr Ala Trp Phe Asp Tyr Ser Met 
150 155 160 

ctg cat cgc aag cac tgg gag cac cac aac cat act ggc gaa gtg ggg 704 
25 Leu His Arg Lys His Trp Glu His His Asn His Thr Gly Glu Val Gly ' 
165 170 175 

aaa gac cct gac ttc cac aag gga aat ccc ggc ctt gtc ccc tgg ttc 752 
Lys Asp Pro Asp Phe His Lys Gly Asn Pro Gly Leu Val Pro Trp Phe 
30 180 185 190 195 

gec age ttc atg tec age tac atg tec ctg tgg cag ttt gee egg ctg 8 00 

Ala Ser Phe Met Ser Ser Tyr Met Ser Leu Trp Gin Phe Ala Arg Leu 
200 205 210 



gca tgg tgg gca gtg gtg atg caa atg ctg ggg gcg ccc atg gca aat 848 
Ala Trp Trp Ala Val Val Met Gin Met Leu Gly Ala Pro Met Ala Asn 
215 220 225 

40 etc eta gtc ttc atg get gca gee cca ate ttg tea gca ttc cgc etc 896 
Leu Leu val Phe Met Ala Ala Ala Pro He Leu Ser Ala Phe Arg Leu 
230 235 240 

ttc tac ttc ggc act tac ctg cca cac aag cct gag cca ggc cct gca 944 
45 Phe Tyr Phe Gly Thr Tyr Leu Pro His Lys Pro Glu Pro Gly Pro Ala 
245 250 255 

gca ggc tct cag gtg atg gee tgg ttc agg gee aag aca agt gag gca 992 
Ala Gly Ser Gin Val Met Ala Trp Phe Arg Ala Lys Thr Ser Glu Ala 
50 260 265 270 275 



8 



tct gat gtg atg agt ttc ctg aca tgc tac cac ttt gac ctg cac tgg 
ser Asp Val Met Ser Phe Leu Thr Cys Tyr His Phe Asp Leu His Trp 
280 285 290 

5 

gag cac cac agg tgg ccc ttt gcc ccc tgg tgg cag ctg ccc cac tgc 
Glu His His Arg Trp Pro Phe Ala Pro Trp Trp Gin Leu Pro His Cys 
295 300 305 

10 cgc cgc ctg tec ggg cgt ggc ctg gtg cct gcc ttg gca tga 
Arg Arg Leu Ser Gly Arg Gly Leu Val Pro Ala Leu Ala 
310 315 320 



15 



20 



25 



30 



cctggtccct ccgctggtga cccagcgtct gcacaagagt gtcatgetae agggtgctgc 
ggccagtggc agcgcagtgc actctcagcc tgtatggggc taccgctgtg ccactgagca 
ctgggcatgc cactgagcac tgggcgtgct actgagcaat gggcgtgcta ctgagcaatg 
ggcgtgctac tgacaatggg cgtgctactg gggtctggca gtggctagga tggagtttga 
tgcattcagt agcggtggcc aacgtcatgt ggatggtgga agtgctgagg ggtttaggca 
geeggcattt gagagggcta agttataaat cgcatgctgc tcatgcgcac atatctgeae 
acagecaggg aaatcccttc gagagtgatt atgggacact tgtattggtt tegtgetatt 
gttttattca gcagcagtac ttagtgaggg tgagagcagg gtggtgagag tggagtgagt 
gagtatgaac ctggtcagcg aggtgaacag cctgtaatga atgactctgt ct 



1040 

1088 

1130 

1190 

1250 

1310 

1370 

1430 

1490 

1550 

1610 

1662 



<210> 4 

35 <211> 320 

<212> PRT 

<213> Haematococcus pluvialis 

40 



45 



<400> 4 

Met His Val Ala Ser Ala Leu Met Val Glu Gin Lys Gly Ser Glu Ala 
15 10 15 



50 



Ala Ala Ser Ser Pro Aso Val Leu Arg Ala Trp Ala Thr Gin Tyr His 

25 30 



20 



PF 53863 



9 



Met Pro Ser Glu Ser Ser Asp Ala Ala Arg Pro Ala Leu Lys His Ala 
35 40 45 

5 

Tyr Lys Pro Pro Ala Ser Asp Ala Lys Gly He Thr Met Ala Leu Thr 
50 55 60 

10 

He He Gly Thr Trp Thr Ala Val Phe Leu His Ala He Phe Gin He 
65 " 70 75 80 

15 Arg Leu Pro Thr Ser Met Asp Gin Leu His Trp Leu Pro Val Ser Glu 

85 90 95 



Ala Thr Ala Gin Leu Leu Gly Gly Ser Ser Ser Leu Leu His He Ala 
20 100 105 11° 



Ala Val Phe He Val Leu Glu Phe Leu Tyr Thr Gly Leu Phe He Thr 
115 

25 



120 125 



Thr His Asp Ala Met His Gly Thr He Ala Leu Arg His- Arg Gin Leu 
130 "5 140 

30 

Asn Asp Leu Leu Gly Asn He Cys He Ser Leu Tyr Ala Trp Phe Asp 
145 " 150 155 160 

35 Tyr Ser Met Leu His Arg Lys His Trp Glu His His Asn His Thr Gly 

165 170 175 



Glu Val Gly Lys Asp Pro Asp Phe His Lys Gly Asn Pro Gly Leu Val 
40 180 185 190 

Pro Trp Phe Ala Ser Phe Met Ser Ser Tyr Met Ser Leu Trp Gin Phe 
195 200 205 

45 

Ala Arg Leu Ala Trp Trp Ala Val Val Met Gin Met Leu Gly Ala Pro 
210 215 220 



50 



Ph 53863 

10 

Met Ala Asn Leu Leu Val Phe Met Ala Ala Ala Pro lie Leu Ser Ala 
225 230 235 240 



5 Phe Arg Leu Phe Tyr Phe Gly Thr Tyr Leu Pro His Lys Pro Glu Pro 

245 250 255 



Gly Pro Ala Ala Gly Ser Gin Val Met Ala Trp Phe Arg Ala Lys Thr 
10 ' 260 265 270 



Ser Glu Ala Ser Asp Val Met Ser Phe Leu Thr Cys Tyr His Phe Asp 
275 280 285 

15 

Leu His Trp Glu His His Arg Trp Pro Phe Ala Pro Trp Trp Gin Leu 
290 295 300 

20 

Pro His Cys Arg Arg Leu Ser Gly Arg Gly Leu Val Pro Ala Leu Ala 
305 310 315 220 



25 <210> 5 

<211> 729 

<212> DNA 

30 

<213> Agrobacterium aurantiacum 

35 <220> 

<221> CDS 

<222> (1)..(729) 

40 

<223> 



45 <400> 5 

atg age gca cat gec ctg ccc aag gca gat ctg acc gec acc age ctg 
Met Ser Ala His Ala Leu Pro Lys Ala Asp Leu Thr Ala Thr Ser Leu 
X 5 10 15 

50 ate gtc teg ggc ggc ate ate gec get tgg ctg gec ctg cat gtg cat 



PF 53863 

11 

He Val Ser Gly Gly He He Ala Ala Trp Leu Ala Leu His Val His 
20 25 30 

gcg ctg tgg ttt ctg gac gca gcg gcg cat ccc ate ctg gcg ate gca 
5 Ala Leu Trp Phe Leu Asp Ala Ala Ala His Pro He Leu Ala He Ala 
35 40 45 

aat ttc ctg ggg ctg acc tgg ctg teg gtc gga ttg ttc ate ate gcg 
Asn Phe Leu Gly Leu Thr Trp Leu Ser Val Gly Leu Phe He He Ala 
10 50 55 60 

cat gac gcg atg cac ggg teg gtg gtg ccg ggg cgt ccg cgc gec aat 
His Asp Ala Met His Gly Ser val Val Pro Gly Arg Pro Arg Ala Asn 
65 70 75 80 

gcg gcg atg ggc cag ctt gte ctg tgg ctg tat gec gga ttt teg tgg 
Ala Ala Met Gly Gin Leu Val Leu Trp Leu Tyr Ala Gly Phe Ser Trp 
85 90 95 

20 cgc aag atg ate gtc aag cac atg gec cat cac cgc cat gec gga acc 
Arg Lys Met He Val Lys His Met Ala His His Arg His Ala Gly Thr 
100 105 110 

gac gac gac ccc gat ttc gac cat ggc ggc ccg gtc cgc tgg tac gec 
25 Asp Asp Asp Pro Asp Phe Asp His Gly Gly Pro Val Arg Trp Tyr Ala 
115 120 125 



144 



192 



240 



288 



336 



384 



432 



cgc ttc ate ggc acc tat ttc ggc tgg cgc gag ggg ctg ctg ctg ccc 
Arg Phe He Gly Thr Tyr Phe Gly Trp Arg Glu Gly Leu Leu Leu Pro 
30 130 135 140 

gtc ate gtg acg gtc tat gcg ctg ate ctt ggg gat cgc tgg atg tac 480 
val He Val Thr Val Tyr Ala Leu He Leu Gly Asp Arg Trp Met Tyr 
145 150 155 I 60 

gtg gtc ttc tgg ccg ctg ccg teg ate etg gcg teg ate cag ctg ttc 
Val Val Phe Trp Pro Leu Pro Ser He Leu Ala Ser He Gin Leu Phe 
165 170 175 

40 gtg ttc ggc acc tgg ctg ccg cac ego ccc ggc cac gac gcg ttc ccg 
Val Phe Gly Thr Trp Leu Pro His Arg Pro Gly His Asp Ala Phe Pro 
180 185 190 

gac cgc cac aat geg egg teg teg egg ate age gac ccc gtg teg ctg 
45 Asp Arg His Asn Ala Arg Ser Ser Arg He Ser Asp Pro Val Ser Leu 
195 200 205 

ctg acc tgc ttt cac ttt ggc ggt tat cat cac gaa cac cac ctg cac 
Leu Thr Cys Phe His Phe Gly Gly Tyr His His Glu His His Leu His 
50 210 215 220 



528 



576 



624 



672 



12 



ccg acg gtg ccg tgg tgg cgc ctg ccc age acc cgc acc aag ggg gac 720 
Pro Thr Val Pro Trp Trp Arg Leu Pro Ser Thr Arg Thr Lys Gly Asp 
225 230 235 240 

5 

729 

acc gca tga 
Thr Ala 

10 

<210> 6 
<211> 242 
15 <212> PRT 

<213> Agrobacterium aurantiacum 



20 

<400> 6 

Met Ser Ala His Ala Leu Pro Lys Ala Asp Leu Thr Ala Thr Ser Leu 
X 5 10 15 

25 

He Val Ser Gly Gly He lie Ala Ala Trp Leu Ala Leu 'His Val His 
20 25 30 

30 

Ala Leu Trp Phe Leu Asp Ala Ala Ala His Pro lie Leu Ala He Ala 
35 40 45 



35 Asn Phe Leu Gly Leu Thr Trp Leu Ser Val Gly Leu Phe He He Ala 
50 55 60 



His Asp Ala Met His Gly Ser Val Val Pro Gly Arg Pro Arg Ala Asn 
40 65 70 75 80 



Ala Ala Met Gly Gin Leu Val Leu Trp Leu Tyr Ala Gly Phe Ser Trp 
85 90 95 

45 

Arg Lys Met He Val Lys His Met Ala His His Arg His Ala Gly Thr 
100 105 110 



50 



13 

Asp Asp Asp Pro Asp Phe Asp His Gly Gly Pro Val Arg Trp Tyr Ala 
115 120 125 



5 Arg Phe lie Gly Thr Tyr Phe Gly Trp Arg Glu Gly Leu Leu Leu Pro 
130 135 140 



Val He Val Thr Val Tyr Ala Leu He Leu Gly Asp Arg Trp Met Tyr 
10 145 150 155 160 



val Val Phe Trp Pro Leu Pro Ser He Leu Ala Ser He Gin Leu Phe 
165 170 175 

15 

Val Phe Gly Thr Trp Leu Pro His Arg Pro Gly His Asp Ala Phe Pro 
180 185 190 

20 

Asp Arg His Asn Ala Arg Ser Ser Arg He Ser Asp Pro Val Ser Leu 
195 200 205 



25 Leu Thr Cys Phe His Phe Gly Gly Tyr His His Glu His His Leu His 
210 215 220 



pro Thr Val Pro Trp Trp Arg Leu Pro Ser Thr Arg Thr Lys Gly Asp 
30 225 230 235 240 



Thr Ala 

35 

<210> 7 
<211> 1631 

40 

<212> DNA 

<213> Alcaligenes sp. 

45 

<220> 



<221> CDS 

50 



5 



25 



45 



14 

<222> (99) . . (827) 
<223> 



<400> 7 

ctgcaggccg ggcccggtgg ccaatggtcg caaccggcag gactggaaca ggacggcggg 60 

10 ccggtctagg ctgtcgccct acgcagcagg agtttcgg atg tec gga egg aag cct 116 

Met Ser Gly Arg Lys Pro 
1 5 

ggc aca act ggc gac acg ate gtc aat etc ggt ctg ace gee gcg ate 164 
15 Gly Thr Thr Gly Asp Thr He Val Asn Leu Gly Leu Thr Ala Ala He 
10 15 20 

ctg ctg tgc tgg ctg gtc ctg cac gee ttt acg eta tgg ttg eta gat 212 
Leu Leu Cys Trp Leu Val Leu His Ala Phe Thr Leu Trp Leu Leu Asp 
20 25 30 35 

gcg gec gcg cat ccg ctg ctt gee gtg ctg tgc ctg get ggg ctg ace 26 0 

Ala Ala Ala His Pro Leu Leu Ala Val Leu Cys Leu Ala Gly Leu Thr 
40 45 50 

tgg ctg teg gtc ggg ctg ttc ate ate gcg cat gac gca atg cac ggg 308 
Trp Leu Ser Val Gly Leu Phe lie He Ala His Asp Ala 'Met His Gly 
55 60 65 70 

30 tec gtg gtg ccg ggg egg ccg cgc gee aat gcg gcg ate ggg caa ctg 35 6 

Ser Val Val Pro Gly Arg Pro Arg Ala Asn Ala Ala He Gly Gin Leu 
75 80 85 

gcg ctg tgg etc tat gcg ggg ttc teg tgg ccc aag ctg ate gee aag 404 
35 Ala Leu Trp Leu Tyr Ala Gly Phe Ser Trp Pro Lys Leu He Ala Lys 
90 95 100 

cac atg acg cat cac egg cac gee ggc ace gac aac gat ccc gat ttc 
His Met Thr His His Arg His Ala Gly Thr Asp Asn Asp Pro Asp Phe 
40 105 110 115 

ggt cac gga ggg ccc gtg cgc tgg tac ggc age ttc gtc tec ace tat 500 
Gly His Gly Gly Pro Val Arg Trp Tyr Gly Ser Phe Val Ser Thr Tyr 
120 125 130 



452 



ttc ggc tgg cga gag gga ctg ctg eta ccg gtg ate gtc ace ace tat 54 8 

Phe Gly Trp Arg Glu Gly Leu Leu Leu Pro Val He Val Thr Thr Tyr 
135 140 - 145 150 



50 gcg ctg ate ctg ggc gat cgc tgg atg tat gtc ate ttc tgg ccg gtc 



596 



PF 53863 



15 

Ala Leu He Leu Gly Asp Arg Trp Met Tyr Val He Phe Trp Pro Val 
155 160 16S 

ccg gcc gtt ctg gcg teg ate cag att ttc gtc ttc gga act tgg ctg 
5 Pro Ala Val Leu Ala Ser He Gin He Phe Val Phe Gly Thr Trp Leu 
170 175 180 

ccc cac cgc ccg gga cat gac gat ttt ccc gac egg cac aac gcg agg 
Pro His Arg Pro Gly His Asp Asp Phe Pro Asp Arg His Asn Ala Arg 
10 185 190 195 

teg ace ggc ate ggc gac ccg ttg tea eta ctg ace tgc ttc cat ttc 
Ser Thr Gly He Gly Asp Pro Leu Ser Leu Leu Thr Cys Phe His Phe 
200 205 210 



15 



20 



ggc ggc tat cac cac gaa cat cac ctg cat ccg cat gtg ccg tgg tgg 
Gly Gly Tyr His His Glu His His Leu His Pro His Val Pro Trp Trp 
215 ' 220 225 230 

cgc ctg cct cgt aca cgc aag acc gga ggc cgc gca tga cgcaattcct 
Arg Leu Pro Arg Thr Arg Lys Thr Gly Gly Arg Ala 
23 S 240 



25 



35 



cattgtcgtg gcgacagtcc tcgtgatgga gctgaccgcc tattccgtcc aecgctggat ^ 
tatgeaegge cccctaggct ggggctggca caagtcccat cacgaagagc acgaccacgc 
gttggagaag aacga cctct aeggegtegt ettcgeggtg ctggcgacga tcctcttcac 
30 cgtgggcgcc tattggtggc cggtgctgtg gtggatcgcc ctgggcatga eggtctatgg 
gttgatctat ttcatcctgc aegaeggget tgtgcatcaa cgctggccgt tteggtatat 
tccgcggcgg ggctatttcc gcaggctcta ccaagctcat cgcctgcacc aegeggtega 
ggggegggae cactgcgtca getteggett catctatgcc ccacccgtgg acaagctgaa 
gcaggatctg aageggtegg gtgtcctgcg cccccaggac gagegtcegt cgtgatctct 
gatcccggcg tggccgcatg aaatccgacg tgctgctggc aggggcegge cttgccaacg 
gaetgatege getggegate cgcaaggcgc ggcccgacct tcgcgtgctg ctgctggacc 
gtgcggcggg cgcctcggac gggcatactt ggtcctgcca cgacaccgat ttggcgccgc 
actggctgga ccgcctgaag ccgatcaggc gtggcgactg gcccgatcag gaggtgcggt 
tcccagacca ttcgegaagg ctccgggccg gatatggctc gatcgaeggg egggggctga 
50 tgcgtgcggt gacc 



40 



45 



644 
692 
74 0 

788 

837 

897 
957 
1017 
1077 
1137 
1197 
1257 
1317 
1377 
1437 
1497 
1557 
1617 
1631 
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16 



<210> 8 

5 <211> 242 

<212> PRT 

<213> Alcaligenes sp. 

10 



<400> 8 

15 Met Ser Gly Arg Lys Pro Gly Thr Thr Gly Asp Thr He Val Asn Leu 

5 10 15 



Gly Leu Thr Ala Ala He Leu Leu Cys Trp Leu Val Leu His Ala Phe 
20 20 25 30 



Thr Leu Trp Leu Leu Asp Ala Ala Ala His Pro Leu Leu Ala Val Leu 

25 



35 40 45 



Cys Leu Ala Gly Leu Thr Trp Leu Ser Val Gly Leu Phe • He He Ala 
. 50 55 60 

30 

His Asp Ala Met His Gly Ser Val Val Pro Gly Arg Pro Arg Ala Asn 
65 ~ 70 75 80 



35 



Ala Ala He Gly Gin Leu Ala Leu Trp Leu Tyr Ala Gly Phe Ser Trp 



Pro 



85 90 95 



Lys Leu He Ala Lys His Met Thr His His Arg His Ala Gly Thr 



40 100 105 110 



Asp Asn Asp Pro Asp Phe Gly His Gly Gly Pro Val Arg Trp Tyr Gly 

45 



115 120 I 25 



Ser 



Phe Val Ser Thr Tyr Phe Gly Trp Arg Glu Gly Leu Leu Leu Pro 
130 135 140 



50 



17 

Val He Val Thr Thr Tyr Ala Leu He Leu Gly Asp Arg Trp Met Tyr 
145 150 155 I 60 



5 Val He Phe Trp Pro Val Pro Ala Val Leu Ala Ser He Gin He Phe 

165 170 I 75 



Val Phe Gly Thr Trp Leu Pro His Arg Pro Gly His Asp Asp Phe Pro 
10 180 185 190 



Asp Arg His Asn Ala Arg Ser Thr Gly He Gly Asp Pro Leu Ser Leu 
195 200 205 

15 

Leu Thr Cys Phe His Phe Gly Gly Tyr His His Glu His His Leu His 
210 215 220 

20 

Pro His Val Pro Trp Trp Arg Leu Pro Arg Thr Arg Lys Thr Gly Gly 
225 230 235 240 



25 Arg Ala 
<210> 9 

30 

<211> 729 
<212> DNA 
35 <213> Paracoccus marcusii 



<220> 

40 

<221> CDS 
<222> (1) . . (729) 
45 <223> 



<400> 9 

50 atg age gca cat gec ctg ccc aag gca gat ctg acc gec aca age ctg 48 



18 

Met Ser Ala His Ala Leu Pro Lys Ala Asp Leu Thr Ala Thr Ser Leu 
15 10 15 

ate gtc teg ggc ggc ate ate gee gca tgg ctg gee ctg cat gtg cat 96 
5 lie Val Ser Gly Gly He He Ala Ala Trp Leu Ala Leu His Val His 
20 25 30 

gcg ctg tgg ttt ctg gac gcg gcg gee cat ccc ate ctg gcg gtc gcg 144 
Ala Leu Trp Phe Leu Asp Ala Ala Ala His Pro He Leu Ala Val Ala 
10 35 40 45 

aat ttc ctg ggg ctg acc tgg ctg teg gtc gga ttg ttc ate ate gcg 192 

Asn Phe Leu Gly Leu Thr Trp Leu Ser Val Gly Leu Phe He He Ala 
50 55 60 

15 

cat gac gcg atg cac ggg teg gtc gtg ccg ggg cgt ccg cgc gee aat 240 

His Asp Ala Met His Gly Ser Val Val Pro Gly Arg Pro Arg Ala Asn 
65 70 75 80 

20 gcg gcg atg ggc cag ctt gtc ctg tgg ctg tat gee gga ttt teg tgg 288 
Ala Ala Met Gly Gin Leu Val Leu Trp Leu Tyr Ala Gly Phe Ser Trp 
85 90 95 

cgc aag atg ate gtc aag cac atg gee cat cac cgc cat gee gga acc 33 6 

25 Arg Lys Met He Val Lys His Met Ala His His Arg His Ala Gly Thr ' 
100 105 HO 

gac gac gac cca gat ttc gac cat ggc ggc ccg gtc cgc tgg tac gec 384 
Asp Asp Asp Pro Asp Phe Asp His Gly Gly Pro Val Arg Trp Tyr. Ala 
30 115 120 125 

cgc ttc ate ggc acc tat ttc ggc tgg cgc gag ggg ctg ctg ctg ccc 432 

Arg Phe He Gly Thr Tyr Phe Gly Trp Arg Glu Gly Leu Leu Leu Pro 
130 135 140 

35 

gtc ate gtg acg gtc tat gcg ctg ate ctg ggg gat cgc tgg atg tac 480 
Val He Val Thr Val Tyr Ala Leu He Leu Gly Asp Arg Trp Met Tyr 
145 150 155 160 

40 gtg gtc ttc tgg ccg ttg ccg teg ate ctg gcg teg ate cag ctg ttc 528 
Val Val Phe Trp Pro Leu Pro Ser He Leu Ala Ser He Gin Leu Phe 
165 170 175 

gtg ttc ggc act tgg ctg ccg cac cgc ccc ggc cac gac gcg ttc ccg 576 
45 val Phe Gly Thr Trp Leu Pro His Arg Pro Gly His Asp Ala Phe Pro 
180 185 190 



gac cgc cat aat gcg egg teg teg egg ate age gac cct gtg teg ctg 
Asp Arg His Asn Ala Arg Ser Ser Arg He Ser Asp Pro Val Ser Leu 
50 195 200 205 



624 
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ctg acc tgc ttt cat ttt ggc ggt tat cat cac gaa cac cac ctg cac 
Leu Thr Cys Phe His Phe Gly Gly Tyr His His Glu His His Leu His 
210 215 220 

5 

ccg acg gtg ccg tgg tgg cgc ctg ccc age acc cgc acc aag ggg gac 
Pro Thr Val Pro Trp Trp Arg Leu Pro Ser Thr Arg Thr Lys Gly Asp 
225 230 235 240 

10 acc gca tga 
Thr Ala 



15 <210> 10 

<211> 242 

<212> PRT 

20 

<213> Paracoccus marcusii 



25 <400> 10 

Met Ser Ala His Ala Leu Pro Lys Ala Asp Leu Thr Ala«Thr Ser Leu 
15 10 I 5 

30 

He Val Ser Gly Gly He He Ala Ala Trp Leu Ala Leu His Val His 
20 25 30 



35 Ala Leu Trp Phe Leu Asp Ala Ala Ala His Pro He Leu Ala Val Ala 
35 40 45 

Asn Phe Leu Gly Leu Thr Trp Leu Ser Val Gly Leu Phe He He Ala 
40 50 55 60 

His Asp Ala Met His Gly Ser Val Val Pro Gly Arg Pro Arg Ala Asn 
65 70 75 80 

45 

Ala Ala Met Gly Gin Leu Val Leu Trp Leu Tyr Ala Gly Phe Ser Trp 
85 90 9 5 



672 



720 



729 



50 



rr ooooo 



20 

Arg Lys Met lie Val Lys His Met Ala His His Arg His Ala Gly Thr 
100 105 110 



5 Asp Asp Asp Pro Asp Phe Asp His Gly Gly Pro Val Arg Trp Tyr Ala 
115 120 125 



Arg Phe He Gly Thr Tyr Phe Gly Trp Arg Glu Gly Leu Leu Leu Pro 
10 130 135 140 



Val He Val Thr Val Tyr Ala Leu He Leu Gly Asp Arg Trp Met Tyr 
145 150 155 160 

15 

Val Val Phe Trp Pro Leu Pro Ser He Leu Ala Ser He Gin Leu Phe 
165 170 I 75 

20 

Val Phe Gly Thr Trp Leu Pro His Arg Pro Gly His Asp Ala Phe Pro 
180 185 190 



25 Asp Arg His Asn Ala Arg Ser Ser Arg He Ser Asp Pro Val Ser Leu 
195 200 205 



Leu Thr Cys Phe His Phe Gly Gly Tyr His His Glu His His Leu His 
30 210 215 220 



Pro Thr Val Pro Trp Trp Arg Leu Pro Ser Thr Arg Thr Lys Gly Asp 
225 230 235 240 

35 

Thr Ala 



40 

<210> 11 

<211> 1629 

45 <212> DNA 

<213> Synechococcus sp. 



50 



PF 53863 



21 



<220> 

<221> CDS 

5 <222> (1)..(1629) 
<223> 



10 



15 



20 



25 



<400> 11 

atg ate acc acc gat gtt gtc att att ggg gcg ggg cac aat ggc eta 
Met lie Thr Thr Asp Val Val He He Gly Ala Gly His Asn Gly Leu 
1 5 10 15 

gtc tgt gca gec tat ttg etc caa egg ggc ttg ggg gtg acg tta eta 
Val Cys Ala Ala Tyr Leu Leu Gin Arg Gly Leu Gly Val Thr Leu Leu 
20 25 30 

gaa aag egg gaa gta cca ggg ggg gcg gee acc aca gaa get etc atg 
Glu Lys Arg Glu Val Pro Gly Gly Ala Ala Thr Thr Glu Ala Leu Met 
35 40 45 

ccg gag eta tec ccc cag ttt cgc ttt aae cgc tgt gee att gac cac 
Pro Glu Leu Ser Pro Gin Phe Arg Phe Asn Arg Cys Ala He Asp His 
50 55 60 



gaa ttt ate ttt ctg ggg ccg gtg ttg cag gag eta aat tta gee cag 
Glu Phe He Phe Leu Gly Pro Val Leu Gin Glu Leu Asn Leu Ala Gin 
30 65 70 75 80 



35 



40 



tat ggt ttg gaa tat tta ttt tgt gac ccc agt gtt ttt tgt ccg ggg 
Tyr Gly Leu Glu Tyr Leu Phe Cys Asp Pro Ser val Phe Cys Pro Gly 
85 9° 95 

ctg gat ggc caa get ttt atg age tac cgt tec eta gaa aaa acc tgt 
Leu Asp Gly Gin Ala Phe Met Ser Tyr Arg Ser Leu Glu Lys Thr Cys 
100 105 HO 

gec cae att gee acc tat age ccc cga gat gcg gaa aaa tat egg caa 
Ala His He Ala Thr Tyr Ser Pro Arg Asp Ala Glu Lys Tyr Arg Gin 
115 120 125 



ttt gtc aat tat tgg acg gat ttg etc aae get gtc cag cct get ttt 
45 Phe" val Asn Tyr Trp Thr Asp Leu Leu Asn Ala Val Gin Pro Ala Phe 
130 135 140 

aat get ccg ccc cag get tta eta gat tta gec ctg aac tat ggt tgg 
Asn Ala Pro Pro Gin Ala Leu Leu Asp Leu Ala Leu Asn Tyr Gly Trp 
50 145 150 155 l g0 



48 



96 



144 



192 



240 



288 



336 



384 



432 



480 



22 

gaa aac tta aaa tec gtg ctg gcg ate gec ggg teg aaa acc aag gcg 528 
• Glu Asn Leu Lys Ser Val Leu Ala He Ala Gly Ser Lys Thr Lys Ala 
165 170 175 

5 

ttg gat ttt ate cgc act atg ate ggc tec ccg gaa gat gtg etc aat 576 
Leu Asp Phe He Arg Thr Met He Gly Ser Pro Glu Asp Val Leu Asn 
180 185 190 

10 gaa tgg ttc gac age gaa egg gtt aaa get cct tta get aga eta tgt 624 
Glu Trp Phe Asp Ser Glu Arg Val Lys Ala Pro Leu Ala Arg Leu Cys 
195 200 205 

teg gaa att ggc get ccc cca tec caa aag ggt agt age tec ggc atg 672 
15 Ser Glu He Gly Ala Pro Pro Ser Gin Lys Gly Ser Ser Ser Gly Met 
210 215 220 

atg atg gtg gee atg egg cat ttg gag gga att gee aga cca aaa gga 720 
Met Met Val Ala Met Arg His Leu Glu Gly He Ala Arg Pro Lys Gly 
20 225 230 235 240 

ggc act gga gec etc aca gaa gee ttg gtg aag tta gtg caa gee caa 768 
Gly Thr Gly Ala Leu Thr Glu Ala Leu Val Lys Leu Val Gin Ala Gin 
245 250 255 

y 

ggg gga aaa ate etc act gac caa acc gtc aaa egg gta ttg gtg gaa 816 
Gly Gly Lys He Leu Thr Asp Gin Thr Val Lys Arg Val ■ Leu Val Glu 
260 265 270 

30 aac aac cag gcg ate ggg gtg gag gta get aac gga gaa cag tac egg 864 
Asn Asn Gin Ala He Gly Val Glu Val Ala Asn Gly Glu Gin Tyr Arg 
275 280 285 



25 



gee aaa aaa ggc gtg att tct aac ate gat gee cgc cgt tta ttt ttg 
35 Ala Lys Lys Gly Val He Ser Asn He Asp Ala Arg Arg Leu Phe Leu 
290 295 300 

caa ttg gtg gaa ccg ggg gee eta gec aag gtg aat caa aac eta ggg 
Gin Leu Val Glu Pro Gly Ala Leu Ala Lys Val Asn Gin Asn Leu Gly 
40 305 310 315 320 

gaa cga ctg gaa egg cgc act gtg aac aat aac gaa gee att tta aaa 
Glu Arg Leu Glu Arg Arg Thr Val Asn Asn Asn Glu Ala He Leu Lys 
325 330 335 



45 



912 



960 



1008 



ate gat tgt gee etc tec ggt tta ccc cac ttc act gee atg gee ggg 1056 
He Asp Cys Ala Leu Ser Gly Leu Pro His Phe Thr Ala Met Ala Gly 
340 345 350 



50 ccg gag gat eta acg gga act att ttg att gee gac teg gta cgc cat 



1104 



1248 



23 

Pro Glu Asp Leu Thr Gly Thr lie Leu lie Ala Asp Ser Val Arg His 
355 360 365 

gtc gag gaa gcc cac gcc etc att gec ttg ggg caa att ccc gat get 1152 
5 Val Glu Glu Ala His Ala Leu lie Ala Leu Gly Gin He Pro Asp Ala 
370 375 380 

aat ccg tct tta tat ttg gat att ccc act gta ttg gac ccc acc atg 1200 
Asn Pro Ser Leu Tyr Leu Asp He Pro Thr Val Leu Asp Pro Thr Met 
10 385 390 395 400 

gcc ccc cct ggg cag cac acc etc tgg ate gaa ttt ttt gcc ccc tac 

Ala Pro Pro Gly Gin His Thr Leu Trp He Glu Phe Phe Ala Pro Tyr 
405 410 415 

15 

cgc ate gcc ggg ttg gaa ggg aca ggg tta atg ggc aca ggt tgg acc 1296 

Arg He Ala Gly Leu Glu Gly Thr Gly Leu Met Gly Thr Gly Trp Thr 
420 425 430 

20 gat gag tta aag gaa aaa gtg gcg gat egg gtg att gat aaa tta acg 1344 
Asp Glu Leu Lys Glu Lys Val Ala Asp Arg Val He Asp Lys Leu Thr 
435 440 445 

gac tat gcc cct aac eta aaa tct ctg ate att ggt cgc cga gtg gaa 13 92 

25 Asp Tyr Ala Pro Asn Leu Lys Ser Leu He He Gly Arg Arg Val Glu 
450 455 460 



1488 



agt ccc gcc gaa ctg gcc caa egg ctg gga agt tac aac ggc aat gtc 1440 
Ser Pro Ala Glu Leu Ala Gin Arg Leu Gly Ser Tyr Asn Gly Asn Val 
30 465 470 475 480 

tat cat ctg gat atg agt ttg gac caa atg atg ttc etc egg cct eta 

Tyr His Leu Asp Met Ser Leu Asp Gin Met Met Phe Leu Arg Pro Leu 
485 490 495 

35 

ccg gaa att gcc aac tac caa acc ccc ate aaa aat ctt tac tta aca 153 6 

Pro Glu He Ala Asn Tyr Gin Thr Pro He Lys Asn Leu Tyr Leu Thr 
500 505 510 

40 ggg gcg ggt acc cat ccc ggt ggc tec ata tea ggt atg ccc ggt aga 1584 
Gly Ala Gly Thr His Pro Gly Gly Ser He Ser Gly Met Pro Gly Arg 
515 520 525 

aat tgc get egg gtc ttt tta aaa caa caa cgt cgt ttt tgg taa 162 9 

45 Asn Cys Ala Arg Val Phe Leu Lys Gin Gin Arg Arg Phe Trp 
530 535 540 



50 



<210> 12 



24 

<211> 542 
<212> PRT 
5 <213> Synechococcus sp. 



<400> 12 

10 

Met lie Thr Thr Asp Val Val lie He Gly Ala Gly His Asn Gly Leu 
15 10 15 



15 Val Cys Ala Ala Tyr Leu Leu Gin Arg Gly Leu Gly Val Thr Leu Leu 
20 25 30 



Glu Lys Arg Glu Val Pro Gly Gly Ala Ala Thr Thr Glu Ala Leu Met 
20 35 40 45 



Pro Glu Leu Ser Pro Gin Phe Arg Phe Asn Arg Cys Ala He Asp His 
50 55 60 

25 

Glu Phe lie Phe Leu Gly Pro Val Leu Gin Glu Leu Asn 'Leu Ala Gin 
65 70 75 80 

30 

Tyr Gly Leu Glu Tyr Leu Phe Cys Asp Pro Ser Val Phe Cys Pro Gly 
85 90 95 



35 Leu Asp Gly Gin Ala Phe Met Ser Tyr Arg Ser Leu Glu Lys Thr Cys 
100 105 110 



Ala His lie Ala Thr Tyr Ser Pro Arg Asp Ala Glu Lys Tyr Arg Gin 
40 115 120 125 



Phe Val Asn Tyr Trp Thr Asp Leu Leu Asn Ala Val Gin Pro Ala Phe 
130 135 140 

45 

Asn Ala Pro Pro Gin Ala Leu Leu Asp Leu Ala Leu Asn Tyr Gly Trp 
145 150 155 160 



50 



25 

Glu Asn Leu Lys Ser Val Leu Ala lie Ala Gly Ser Lys Thr Lys Ala 



155 170 



175 



5 Leu Asp Phe lie Arg Thr Met He Gly Ser Pro Glu Asp Val Leu Asn 
180 185 190 



Glu Trp Phe Asp Ser Glu Arg Val Lys Ala Pro Leu Ala Arg Leu Cys 
10 195 200 205 



Ser Glu He Gly Ala Pro Pro Ser Gin Lys Gly Ser Ser Ser Gly Met 
210 215 220 

15 



Met Met val Ala Met Arg His Leu Glu Gly He Ala Arg Pro Lys Gly 
22S 



230 235 240 



20 

Gly Thr Gly Ala Leu Thr Glu Ala Leu Val Lys Leu Val Gin Ala Gin 
245 250 255 



25 Gly Gly Lys He Leu Thr Asp Gin Thr Val Lys Arg Val Leu Val Glu 
260 265 270 



Asn Asn Gin Ala He Gly Val Glu Val Ala Asn Gly Glu Gin Tyr Arg 
30 275 280 285 

Ala Lys Lys Gly Val He Ser Asn He Asp Ala Arg Arg Leu Phe Leu 
290 295 300 

35 

Gin Leu Val Glu Pro Gly Ala Leu Ala Lys Val Ash Gin Asn Leu Gly 
305 310 315 320 

40 

Glu Arg Leu Glu Arg Arg Thr Val Asn Asn Asn Glu Ala He Leu Lys 
325 330 335 



45 He Asp Cys Ala Leu Ser Gly Leu Pro His Phe Thr Ala Met Ala Gly 
340 345 350 

Pro Glu Asp Leu Thr Gly Thr He Leu He Ala Asp Ser Val Arg His 
50 355 360 365 



26 



Val Glu Glu Ala His Ala Leu lie Ala Leu Gly Gin He Pro Asp Ala 
370 375 380 

5 

Asn Pro Ser Leu Tyr Leu Asp He Pro Thr Val Leu Asp Pro Thr Met 
385 390 395 400 

10 

Ala Pro Pro Gly Gin His Thr Leu Trp He Glu Phe Phe Ala Pro Tyr 
405 410 415 



15 Arg He Ala Gly Leu Glu Gly Thr Gly Leu Met Gly Thr Gly Trp Thr 
420 425 430 



Asp Glu Leu Lys Glu Lys Val Ala Asp Arg Val He Asp Lys Leu Thr 
20 435 440 445 



Asp Tyr Ala Pro Asn Leu Lys Ser Leu He He Gly Arg Arg Val Glu 
450 455 460 

25 

Ser Pro Ala Glu Leu Ala Gin Arg Leu Gly Ser Tyr Asn' Gly Asn Val 
465 470 475 480 

30 

Tyr His Leu Asp Met Ser Leu Asp Gin Met Met Phe Leu Arg Pro Leu 
485 490 495 



35 Pro Glu He Ala Asn Tyr Gin Thr Pro He Lys Asn Leu Tyr Leu Thr 
500 505 510 



Gly Ala Gly Thr His Pro Gly Gly Ser He Ser Gly Met Pro Gly Arg 
40 515 520 525 



Asn Cys Ala Arg Val Phe Leu Lys Gin Gin Arg Arg Phe Trp 
530 535 540 

45 

<210> 13 



<211> 776 

50 



5 



10 



25 



27 

<212> DNA 

<213> Bradyrhizobium sp. 



<220> 

<221> CDS 

<222> (1) . . (774) 

<223> 



15 

<400> 13 

atg cat gca gca acc gcc aag get act gag ttc ggg gec tct egg cgc 48 
Met His Ala Ala Thr Ala Lys Ala Thr Glu Phe Gly Ala Ser Arg Arg 
20 1 5 10 15 



gac gat gcg agg cag cgc cgc gtc ggt etc acg ctg gcc gcg gtc ate 
Asp Asp Ala Arg Gin Arg Arg Val Gly Leu Thr Leu Ala Ala Val He 
20 25 30 

ate gcc gcc tgg ctg gtg ctg cat gtc ggt ctg atg ttc ttc tgg ccg 
He Ala Ala Trp Leu Val Leu His Val Gly Leu Met Phe. ,Phe Trp Pro 
35 40 45 

30 ctg acc ctt cac age ctg ctg ccg get ttg cct ctg gtg gtg ctg cag 
Leu Thr Leu His Ser Leu Leu Pro Ala Leu Pro Leu Val Val Leu Gin 
50 55 60 

acc tgg etc tat gta ggc ctg ttc ate ate gcg cat gac tgc atg cac 
35 Thr Trp Leu Tyr Val Gly Leu Phe He He Ala His Asp Cys Met His 
65 70 75 80 

ggc teg ctg gtg ccg ttc aag ccg cag gtc aac cgc cgt ate gga cag 
Gly Ser Leu Val Pro Phe Lys Pro Gin Val Asn Arg Arg He Gly Gin 
40 35 90 95 

etc tgc ctg ttc etc tat gcc ggg ttc tec ttc gac get etc aat gtc 
Leu Cys Leu Phe Leu Tyr Ala Gly Phe Ser Phe Asp Ala Leu Asn Val 
100 105 I 10 



45 



gag cac cac aag cat cac cgc cat ccc ggc acg gcc gag gat ccc gat 
Glu His His Lys His His Arg His Pro Gly Thr Ala Glu Asp Pro Asp 
115 120 125 



96 



144 



192 



240 



288 



336 



384 



50 ttc gac gag gtg ccg ccg cac ggc ttc tgg cac tgg ttc gcc age 



432 



rr soou^ 



28 

Phe Asp Glu Val Pro Pro His Gly Phe Trp His Trp Phe Ala Ser Phe 
130 135 140 

ttc ctg cac tat ttc ggc tgg aag cag gtc gcg ate ate gca gec gtc 
5 Phe Leu His Tyr Phe Gly Trp Lys Gin Val Ala lie He Ala Ala Val 
145 150 155 I 60 

teg ctg gtt tat cag etc gtc ttc gee gtt ccc ttg cag aac ate ctg 
Ser Leu Val Tyr Gin Leu Val Phe Ala Val Pro Leu Gin Asn He Leu 
10 165 170 175 

ctg ttc tgg gcg ctg ccc ggg ctg ctg teg gcg ctg cag ctg ttc ace 
Leu Phe Trp Ala Leu Pro Gly Leu Leu Ser Ala Leu Gin Leu Phe Thr 
180 185 190 

15 

ttc ggc ace tat ctg ecg cac aag ccg gee acg cag ccc ttc gee gat 
Phe Gly Thr Tyr Leu Pro His Lys Pro Ala Thr Gin Pro Phe Ala Asp 
195 200 205 

20 cgc cac aac gcg egg acg age gaa ttt ccc gcg tgg ctg teg ctg ctg 
Arg His Asn Ala Arg Thr Ser Glu Phe Pro Ala Trp Leu Ser Leu Leu 
210 215 220 

ace tgc ttc cac ttc ggc ttt cat cac gag cat cat ctg cat ccc gat 
25 Thr Cys Phe His Phe Gly Phe His His Glu His His Leu His Pro Asp 
225 230 235 240 

. t 

gcg ccg tgg tgg egg ctg ccg gag ate aag egg egg gee ctg gaa agg 
Ala Pro Trp Trp Arg Leu Pro Glu lie Lys Arg Arg Ala Leu Glu Arg 
30 245 250 255 

cgt gac ta 
Arg Asp 



35 



40 



45 



<210> 14 

<211> 258 

<212> PRT 

<213> Bradyrhizobium sp. 

<400> 14 



480 



528 



576 



624 



672 



s 



720 



768 



776 



Met His Ala Ala Thr Ala Lys Ala Thr Glu Phe Gly Ala Ser Arg Arg 
50 1 5 10 15 



29 



Asp Asp Ala Arg Gin Arg Arg Val Gly Leu Thr Leu Ala Ala Val He 
20 25 30 

5 

He Ala Ala Trp Leu Val Leu His Val Gly Leu Met Phe Phe Trp Pro 
35 40 45 

10 

Leu Thr Leu His Ser Leu Leu Pro Ala Leu Pro Leu Val Val Leu Gin 
50 55 60 



15 Thr Trp Leu Tyr val Gly Leu Phe He He Ala His Asp Cys Met His 
65 " * 70 75 80 

Gly Ser Leu Val Pro Phe Lys Pro Gin Val Asn Arg Arg He Gly Gin 
20 85 90 95 

Leu Cys Leu Phe Leu Tyr Ala Gly Phe Ser Phe Asp Ala Leu Asn Val 
100 105 110 

25 

Glu His His Lys His His Arg His Pro Gly Thr Ala Glu.Asp Pro Asp 
115 120 125 

30 

Phe Asp Glu Val Pro Pro His Gly Phe Trp His Trp Phe Ala Ser Phe 
130 135 140 



35 Phe Leu His Tyr Phe Gly Trp Lys Gin Val Ala He He Ala Ala Val 
145 150 155 ISO 



Ser Leu Val Tyr Gin Leu Val Phe Ala Val Pro Leu Gin Asn He Leu 
40 165 170 175 



Leu Phe Trp Ala Leu Pro Gly Leu Leu Ser Ala Leu Gin Leu Phe Thr 
180 185 190 

45 

Phe Gly Thr Tyr Leu Pro His Lys Pro Ala Thr Gin Pro Phe Ala Asp 
195 200 205 



50 



PF 53863 



30 

Arg His Asn Ala Arg Thr Ser Glu Phe Pro Ala Trp Leu Ser Leu Leu 
210 215 220 



5 Thr Cys Phe His Phe Gly Phe His His Glu His His Leu His Pro Asp 
225 230 235 240 

Ala Pro Trp Trp Arg Leu Pro Glu lie Lys Arg Arg Ala Leu Glu Arg 
10 245 250 255 



15 



20 



25 



30 



Arg Asp 

<210> 15 

<211> 777 

<212> DNA 

<213> Nostoc sp. 

<220> 

<221> CDS 

<222> (1)..(777) 

<223> 



35 



<400> 15 

atg gtt cag tgt caa cca tea tct ctg cat tea gaa aaa ctg gtg tta 
Met Val Gin Cys Gin Pro Ser Ser Leu His Ser Glu Lys Leu Val Leu 
40 1 5 10 15 

ttg tea teg aea ate aga gat gat aaa aat att aat aag ggt ata ttt 
Leu Ser Ser Thr lie Arg Asp Asp Lys Asn lie Asn Lys Gly He Phe 
20 25 30 



45 



att gee tgc ttt ate tta ttt tta tgg gca att agt tta ate tta tta 
He Ala Cys Phe He Leu Phe Leu Trp Ala He Ser Leu He Leu Leu 
35 40 45 



50 etc tea ata gat aea tec ata att cat aag age tta tta ggt ata gee 



48 



96 



144 



192 



PF 53863 



31 

Leu Ser He Asp Thr Ser He He His Lys Ser Leu Leu Gly He Ala 
50 55 60 

atg ctt tgg cag acc ttc tta tat aca ggt tta ttt att act get cat 
5 Met Leu Trp Gin Thr Phe Leu Tyr Thr Gly Leu Phe He Thr Ala His 
65 70 75 80 

gat gec atg cac ggc gta gtt tat ccc aaa aat ccc aga ata aat aat 
Asp Ala Met His Gly Val Val Tyr Pro Lys Asn Pro Arg He Asn Asn 
10 85 90 95 

ttt ata ggt aag etc act eta ate ttg tat gga eta etc cct tat aaa 33 6 

Phe He Gly Lys Leu Thr Leu He Leu Tyr Gly Leu Leu Pro Tyr Lys 
100 105 HO 



15 



35 



gat tta ttg aaa aaa cat tgg tta cac cac gga cat cct ggt act gat 
Asp Leu Leu Lys Lys His Trp Leu His His Gly His Pro Gly Thr Asp 
115 120 125 



aat aat tta att ata ttt tgg atg ata cct tct att tta agt tea gta 
Asn Asn Leu He He Phe Trp Met He Pro Ser He Leu Ser Ser Val 
180 185 190 



240 



288 



384 



432 



20 tta gac cct gat tat tac aat ggt cat ccc caa aac ttc ttt ctt tgg 
Leu Asp Pro Asp Tyr Tyr Asn Gly His Pro Gin Asn Phe Phe Leu Trp 
130 135 140 

tat eta cat ttt atg aag tct tat tgg cga tgg acg caa att ttc gga 480 
25 Tyr Leu His Phe Met Lys Ser Tyr Trp Arg Trp Thr Gin He Phe Gly 
145 150 155 160 

tta gtg atg att ttt cat gga ctt aaa aat ctg gtg cat ata cca gaa 528 
Leu Val Met He Phe His Gly Leu Lys Asn Leu Val His He Pro Glu 
30 165 170 175 



576 



caa eta ttt tat ttt ggt aca ttt ttg cct cat aaa aag eta gaa ggt 624 
Gin Leu Phe Tyr Phe Gly Thr Phe Leu Pro His Lys Lys Leu Glu Gly 
195 200 205 



40 ggt tat act aac ccc cat tgt gcg cgc agt ate cca tta cct ctt ttt 672 
Gly Tyr Thr Asn Pro His Cys Ala Arg Ser He Pro Leu Pro Leu Phe 
210 215 220 



tgg tct ttt gtt act tgt tat cac ttc ggc tac cac aag gaa cat cac 
45 Trp Ser Phe Val Thr Cys Tyr His Phe Gly Tyr His Lys Glu His His 
225 230 235 240 

gaa tac cct caa ctt cct tgg tgg aaa tta cct gaa get cac aaa ata 
Glu Tyr Pro Gin Leu Pro Trp Trp Lys Leu Pro Glu Ala His Lys He 
50 245 250 255 



720 



768 



r*r ooooo 



32 

tct tta taa 777 
Ser Leu 



<210> 16 

<211> 258 

10 

<212> PRT 

<213> Nostoc sp. 

15 

<400> 16 

Met Val Gin Cys Gin Pro Ser Ser Leu His Ser Glu Lys Leu Val Leu 
20 1 5 10 15 



Leu Ser Ser Thr lie Arg Asp Asp Lys Asn lie Asn Lys Gly lie Phe 
20 25 30 

25 

He Ala Cys Phe He Leu Phe Leu Trp Ala He Ser Leu'Ile Leu Leu 
35 40 45 

30 

Leu Ser He Asp Thr Ser He He His Lys Ser Leu Leu Gly He Ala 
50 55 60 



35 Met Leu Trp Gin Thr Phe Leu Tyr Thr Gly Leu Phe He Thr Ala His 
65 70 75 80 



Asp Ala Met His Gly Val Val Tyr Pro Lys Asn Pro Arg He Asn Asn 
40 85 90 95 



Phe He Gly Lys Leu Thr Leu He Leu Tyr Gly Leu Leu Pro Tyr Lys 
100 105 110 

45 

Asp Leu Leu Lys Lys His Trp Leu His His Gly His Pro Gly Thr Asp 
115 120 125 



50 



PF 53863 



33 

Leu Asp Pro Asp Tyr Tyr Asn Gly His Pro Gin Asn Phe Phe Leu Trp 
130 135 140 

5 Tyr Leu His Phe Met Lys Ser Tyr Trp Arg Trp Thr Gin lie Phe Gly 
145 150 155 160 

Leu val Met He Phe His Gly Leu Lys Asn Leu Val His He Pro Glu 
10 165 170 175 

Asn Asn Leu He He Phe Trp Met He Pro Ser He Leu Ser Ser Val 
180 185 19° 

15 

Gin Leu Phe Tyr Phe Gly Thr Phe Leu Pro His Lys Lys Leu Glu Gly 
195 200 205 

20 

Gly Tyr Thr Asn Pro His Cys Ala Arg Ser He Pro Leu Pro Leu Phe 
210 215 220 

25 Trp Ser Phe Val Thr Cys Tyr His Phe Gly Tyr His Lys Glu His His 
225 230 235 240 



Glu Tyr Pro Gin Leu Pro Trp Trp Lys Leu Pro Glu Ala His Lys He 
30 245 250 255 



Ser Leu 

35 

<210> 17 
<211> 2093 

40 

<212> DNA 
<213> Tomate 

45 

<220> 

<221> promoter 

50 



5 



PF 53863 

34 

<222> (1) - . (2093) 
<223> 



<400> 17 

tttgccagta ttacaacagc ttatatgttg agcaggtaaa agcttcaatg ccctattctt 



15 



60 
120 
180 
240 
300 
360 
420 
480 



10 tctacagtta tcaatgttgc tcgtctaata tctggtgttc ttctcgaaat gtcaattggc 
ttgcagcaca ttgtcctcta atatccattc aagcttctta gatgatgaaa catttgtcaa 
atttattaat ttcatagtgt tcagtctcaa ttctttagct ggt tec teat agtaaagttg 
tctaatatga aatgaaaatg ttctgtgtgt tgtactaata ccttttcatg gttgtctata 
gaaegtcgat gaagagccaa acagaaacta ttttgggctg cgatttctga taccattgta 
20 tetgaatget gggtgggagc tcatcagaag ctttacaatg ggtcacatat atggagccgg 
tatgaggaat gctgggaatc agttgcgttt cgcgtgctag gacttttcct tcctggtatt 
tctgcccaca gcccagttga ttacgtgaac tccgtcagac ttggaaagga gagaagtacc ^ 540 

25 

caaatgtcgt ctttttagaa atacttttgt cacaaaatag eggggtttae agctacagaa 600 
gatcatgeag aaggegtcca gtttagtttt tgaaggttgt ttggagttta tttatctaaa 660 
30 gtaaacttaa atcagctttt tgtttatgag ttcagtgaac tatatgttca aataagactt 720 
ccctttgtag atatgtgttt tttttgttgt tgagcacttt gtgtgcattg gataaacccc 78 0 
caacgtgtaa tagctaccat acaagagaag taactcgcac tgtccatgtc ttatgtggct 840 

35 

cgactcagaa agcattcagg gggattgata accaccctcc aaaccaactg aaccattgtg 900 
aataaccacc cttcaaatca accgagtcct cgtgaaggac aaatatgtgg ttttatatac 960 
40 attaaatttt gtttttacat gcttcctctt acttctttag ttttcttgac catatcttgc 1020 
gtttttccct tctgtaattg acacttttct tcaaaccatc cagcaatgtg gaagcttgac 1080 
gattttcctt cagagtagaa attgaaaaga atcaactaaa aaggatagtc cttcgatttg 1140 
atttcegget taaaaataaa ctaataagaa tgagagagcg aataatagaa tattttgaaa 1200 
ttttaaagat attcaactat gttaaattgc gttataaatt tcttaaatta gtagcaccta 1260 
50 atagtttagt tctcaaaagt caaaactact acataatgtg ctcatttttc acattaaaat 1320 



45 



PF 53863 

35 

gcotacatga tgtaaaagta aaactcgtag cattctacgt gttttactca actcaaacat 1380 

cctgttcatt ttaataaacg tacgatgagc ttctctctcc aattttcttt tctttttttt 1440 

5 

ttttaaaaaa atattttttt ttatatcaat ccaaatgggc tccaatttat cataaattag 1500 

gtagaaactt agatattaaa gaaagaaaag ggtttatctc gcaagtgtgg ctatggtggg 1560 

10 acgtgtcaaa ttttggattg tagccaaaca tgagatttga tttaaaggga attggccaaa 1620 

tcaccgaaag caggcatctt catcataaat tagtttgttt atttatacag aattatacgc 1680 

ttttactagt tatagcattc ggtatctttt tctgggtaac tgccaaacca ccacaaattt 1740 

15 

caagtttcca tttaactctt caacttcaac ccaaccaaat ttatttgctt aattgtgcag 1800 

aaccactccc tatatcttct aggtgctttc attcgttccg aggtaagaaa agatttttgt i860 

20 ttctttgaat gctttatgcc actcgtttaa cttctgaggt ttgtggatct tttaggcgac 1920 

tttttttttt tttgtatgta aaatttgttt cataaatgct tctcaacata aatcttgaca 1980 

aagagaagga attttaccaa gtatttaggt tcagaaatgg ataattttct tactgtgaaa ^ 2040 
tatccttatg gcaggtttta ctgttatttt tcagtaaaat gcctcaaatt gga 



25 



2093 



30 



<210> 18 

<211> 4760 

<212> DNA 

35 <213> Tomate 



<220> 

40 

<221> promoter 
<222> (1) . . (4760) 
45 <223> 



<400> 18 

50 tctagattga aataaacctt attgcattta gtatatgaga atgcatctat aaaataatgt 



PF 53863 

36 

ctatttttgg tggaaaatat ttgtgcgcca aagcacggtt tgtattttat attttacaat 120 

atttttgcac ggtaatatag ttgcaaggtt ttacaaacga attatctctt gaactttaaa 180 

5 

ttaagttcac agtttattcc aaaaataatg ttcaacttct aatcatatct ccccctattg 240 

ctagaaaaat ataacattta cgcccaactt catttaggat ccatttttat gcatggtgga 300 

10 gcaattggat catatactac atattttttt aaaaaaaata gatagaaatt atttaatctt 360 

gattccgaat caattgtgat gggaaaacct tattagtttg atgtgtacat ataatgtttt 420 

atgtcaaata aatttatttt atactaaatt ttatttgaaa gtatttttct cataacaaat 480 

15 

aatttaacta tattggagac atgaaaattc tacaaaacca acttgcatta tcaacataat 540 

tttatagttt gaaattgtgc tcttaattaa acaattcaag ataacaatct ggtaaaatta 600 

20 aaattacaag ttgataacaa acatatacat atgtacatct catagatgca ttcattaaat 660 

catataatag taaatgcttc acaatagaag ggtctatatt catttttttt ttatgtgtca 720 

aacaattttg aggaattcaa tttcatcttt aactggtaca ataatcattt tatcatgaaa 780 

25 

ataagcagct caagagaatt tttgaagaat cttttatttc tttaacattt aaccacatga 840 

atttttaatt tttttttgca atacatttaa accgaaatgg tcaaacgatc aaccaactga 900 

30 tctttattct aataaacttc tagtttacat ttgcatgtga gtgcatcatc attatcatat 960 

ttgtacacaa caaacaagaa aaaaatataa acaatatttt atttaaatat ttatattcca 1020 

ctttgactgt agatattaaa tcttgtcatc atttatagtc tcaatattat aattttttta 1080 

35 

ttttttcaaa attcaaaagt ttacaattat ttttttgaac tataatatta tccaagatga 1140 

acatctcaag aagaaaatta ttaatattgt tatggttaaa attttacata caatacttgt 1200 

40 tttttgcttt acttttatct taccgtagat acacaatcga cgataactta gtgatcacac 1260 

aataataatt attttgttca tgacacaata tttataagaa atacttattt ctttctttta 1320 

tccttcagta gttcataata aaaacatacc ataatatttg tgatgcattc atagtacgta 13 80 

45 

atgaaatgac aatttatgtc aaattatttt cttttatact ctcaaacctc ccgtaaaggt 1440 

gagatgagtc atttatccaa ttatacataa atatgtcttt attcatgctc tttatcacat 1500 

50 tctgacacat tcacttaatt tcaagagtaa gcaagcatga taactgaaac tatttatgcg 1560 



37 

tatcttacct tgatatttga cacattacat gacacacctc aacatcactt tcaaagatta 1620 

agcgcaccac catattatct ttcttttttt ttttatgaag gttttataaa attattaaat 1680 

5 

taggtccaaa aaattgtttg tcaaataacc ttttatacta gattgatgac aaaaattacc 1740 

tttacgtttt gaaagaccat tttaagacct aatctatcag tgactcctta aagttggcac 1800 

10 aatatttcac ttagacaccc taattgaatg atgttcattt taaacaccca atgtagggtt 1860 

ccgctatatc attttgacac atttcttaac atcaacaaaa atatataatg agtatgtgat 192 0 

atactcgcga atgacgtgaa aaatgaagac atttgttatt tgtatcaaag tagttactaa 1980 

15 

ataattaatt ttgaataaaa ataaaagctg accagtaaat caataacaca taatattttc 2040 

cacctaataa ttaaaatata aaataaaaaa gagccatctc agggtcatct gcccaccatt 2100 

20 gctatttcaa agaaatttgt acgttagttt atagaaattg atgttaaaat tctttcaaga 2160 

aaaatttatg aatgaattta ttctctaatt taaaaatatt ttctgttatt tttgttgaaa 2220 

gaaatttaac ttggataaaa tggtggttaa aactggaaag aagaaaagag aaaaaataat 2280 
25 ' 

taaaaatcat ttcacgctct aatcaatgag cgtatcacat tcattatgtt atataagcaa 2340 

aagtgacaaa acgaaaataa tatattacat gaaatgtcta aaataaatat cgtctaatta 2400 

30 aaatatctaa gtaacatatt gtgcctaact ttagagggat catcaataag ttaaacccca 2460 

ttttaataac tcataattgt cctttttatt taatattgtc acaaatcaca atgataatta 2520 

acattaattt gtcctttgtg acgtccatat tcatgcattt aaccaatcat cttcatttgg 2580 

35 

acttattatc acaattatcc cactttcctc acaaaatgga gcattcaagt ggaatagact 2640 

acacgatttt taatttcatc aaaaacatct ttttgcttta ttcattatta tattgtcgct 2700 

40 attgttgaat tttatttgcc ctaaatttct taccataaat agatttttct tttagaaaaa 2760 

ggagattgac taattctttt cttgtaggaa aaggtttagg actctataaa tagagacata 2 82 0 

ttccttctaa cttaatcaac atttacaatg tagtcttaaa gactttgaaa gtttttggtt 2880 

45 

agggggagaa attgtgggtc acaagcttga tacgttatca attgtgtaaa cctcccatgt 2 940 

attctgagtg aatttggttg aggttgtttc cctctgtatt ttgtactctc atatttatag 3 000 

50 tggattgttc atctctttcg tggacgtagg tcgattgacc gtcgattgac cgaaccacgt 3 060 



PF 53863 

38 

taaatctttg tattttttga tatatttctc attatcttct tactcgtgat ctttcaaggt 3120 

ttgcattgct atcttccgcg ttacaccaac ttatttacga tcctaacagc tatggtgtgg 3180 

5 

aaacataaat caaacatttt actgatataa acacatcttt gattataaca tgatagaaat 3240 

ttgagcccaa ctttttatca tcattatata caaaaagttc taaatttttt ttttgatgta 33 00 

10 gtaaaactta aatccatagt cttgccccta aaccaatgac ataatatata acccaaaata 3360 

tactagtttt cgccctcgag ccctttaaaa agtatagtca atatttacgg tgaccgtgaa 3420 

tttcttaatt atgatatata atttaaaaga aatcatgatc acattctact gatgagaaca 3 480 

15 

tgtgctaatc aagggaaaac atggatgtga aaaatacttt ttgttaaaag taaaaaaaaa 3540 

tgtgaaattt tgttagttat ttactaccta tacattattt gagcatgtgc aaactttaca 3 600 

20 aatacctaat agaagatttt cacctgcctg tatatatgta aattaattat aatgaacact 3 660 

ctcacataaa ataattatca gtatatacat taatacttgc cctccacaat gaattaaata 3720 

aaatgtagaa cat gate tac acttcaataa aactaagacc ataaagaata atttcaaaat 3 780 

25 

atacacatgt caacaataaa ttatttgeat attatattaa cttactaaac aatctttact 3 840 

. « 

tttgaaatat aaaaataatc aagttataag tetgetcaaa gtaaagcact tgttagactc 3 900 

30 atctgatttt gagaaggtaa gcaaattgat ggtgcataat agtcacaagt aaaatataaa 3960 

atagatttca ttagtaaaat tgttttttac tttctttata tataattatc aatatccttc 4020 

aatggtaggt taattatatt gttaacttct tgttgaatta aagcaataag acaagaatat 4080 

35 

taaagataaa agaacaataa aaatagaaag actaagagat aagagttttc ttattcttct 4140 

ttcaataagt atcatcaagt gtatacaata taaatttttg tatttttgat ctatctattt 420 0 

40 ataatgttat atataagcat acaaaagatc agtcataaat atgactttaa tcatgaaaat 4260 

aatgaaagag attatgaagg cgtaaggtta ctagaataat agtcattaaa aaaaggggtt 432 0 

atctttataa ttgaataatt gatgaagtaa tggagataat tagtgagcat aaattttttt m 4380 

45 

aaaaaaatgg acatttacac tataatattt tataacactt tcccttaaac atctaggtat 4440 

aaataatgag tcttgtcaaa atcttagtag gaaaaattct gtgaaatttt tttagtgaaa 4500 

50 acaaatgata taaatatctt gaatactcat tatttgttgt ctcattaaaa atcttatctg 4 560 



10 



30 



35 



39 

acctataaaa taaattattt gctcaactca aaatagtttt tcattctaaa attagtataa 4 62 0 

ttattagtga atatttaatt aacataattg tatactaagg ggcctataaa ttggattctt 468 0 

ctcaaagaaa aataaaatca ccacacaact ttcttcttct gctcatcaat tagcaattaa 474 0 
tccaaaacca ttatggctgc 4760 



<210> 19 

<211> 1229 

15 <212> DNA 

<213> Tomate 

20 

<220> 

<221> promoter 

25 <222> (1) . . (1229) 
<223> 



<400> 19 

gatcttactt taccataatg gtgaaaagga tagagaccca catggttttt acttcgttat 60 



agagacaaga tgaaaacaaa tctaaaattt aatattatag atggatagat gatggacaac 12 0 

aaaaagagaa aagaagatac tggtcattgg tccaaaacag ccacccgaat caatatatga 180 

ccgaaaaaca aaagctacag aatcatatct gtgcaacggt gccacagtgc tataggatag 24 0 

40 cacaaccaca ctgtcacata aaaaagagga ttttgcactc gttttagatg gagtttcgta 3 00 

attttcgggt ctttcaagct taaatatata cttcattaaa gcttcgaatt ttgtaatgtt 3 60 

caattctacc tctttgatgt tcgataccta taaaataatt aaataaacgt atagacgtag 420 

45 

gaacaattaa gcggagttag atagtgcatt tatgattcta cctgtgagtg caatggtaaa 480 

atggacatta taaaagagta ggggcaaaga gggaagtgaa aaattctccc cacttagcca 540 

50 tgtttaatat agtagggata ggaatatgta ataagtagtg ttttttctat ttaattttct 600 
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40 

gtatacttct tccatctcct ttaattatta aaaggttttc ctctctttac tctttctctc 
taaattacta ttctgaagta tattttcttt tataaaaaga gtaataaact ttatttccat 

5 

taaaagaaca aacaacaaga aatgataatc aaatacacat tcatattttt aaaaaaaaag 
ttaaacaaga tatagaaata gttatcaaat atatttatgt tgtcattcct tgtatacaat 
10 ggcattcctt tagctttgtt tatgtatttc ctgagcttct cttagtgtac tatatccttt 

aatattaatg catctttcga tcttgctaag atatgataaa aatagacgac acgtgtcaca 960 
acctaattga gatatttcga tgtactttct atccgtctta gcttgtaatt aattattgtt 
aaaaaagaat actcaattaa ctagaaacaa gaaataagaa acgaaaacat tacaaaacgg 
agttgaagcg tgcaaatttg tggaaatgat tgttatcatg aaccagaaaa cattaaataa 
20 ctcttcctat aaaaggccct tattcttcac tttctcaaat cacgtcctaa agatatcaaa 1200 
gatttcaact gatagcaaaa agcactact 



15 



660 
720 
780 
840 
900 



1020 
1080 
1140 



1229 



25 <210> 20 

<211> 845 

<212> DNA 

<213> Tomate 



30 



35 <220> 

<221> promoter 
<222> (1) . . (845) 

40 

<223> 



45 <400> 20 

ctgttattga atttctataa aatgttataa tattgatttc ttaatgatca gttaactacg 
tgattatttg atatgttttt aatctaaaat gtgatatgta aaatatagaa gaaaaaaaat 
50 taaaaagaac tttaagaaaa aaatttcaac ccaccccaac ctaaaatcct aggtccgcca 



rr ooooo 



41 

tggtaattat agatatatga tgatgaaggg caaatattgg tctatgagaa tttcggtgat 
actaccgctt gaagagcaat aatggttttg ggactccgat gagggaaaca ttcaaatatg 

5 

atggattttg gtgatactat gtttacccga gctagctatc acagaataat ctacatccca 
caaatgaaat atgttatagg ctaccaatta ggaagtagtg gaartatgaa gaagtaggga 
10 tgtgcaaata taagagaaaa tttgaaaatt atgattgaaa caagttatgt ttttttaact 
agatgaatta aatggtttaa agatttgtag atttataatc aaacaattac cgctactcta 
tcggtgacta ccaattccat cattgtaaat aacaaataac agatccgttg ctggatgtct 
tagtgccgtg aagcctacaa atcacactat aaactgctta gctctcgagc gttactaatt 
tggtgattac caattccaac attgcgactt cttctactag tagractaaa atagcaagta 
20 atatgcattt gtggtaagat gtttggtgtt aacctttcct aaccagacta taaatgacct 
caacactata gtggagtttc atcgatcatc attctaaacg aaaaacttga agtgaaagca 
tcaag 



15 



240 

300 

360 

420 

480 

540 

600 

660 

720 

780 

840 

845 



25 



30 



35 



40 



<210> 21 

<211> 3417 

<212> DNA 

<213> Tomate 

<220> 

<221> promoter 

<222> (1)..(3417) 
<223> 



45 



<400> 21 

aagcttggct gcaggtcgac ctgcaggtca acggatcaat gccttgttaa taatatgaaa 60 
50 ataagacgta aaagaagtct tgcatatgca ccataatatt agacttatgg acaaaagtaa 12 0 



42 

gttggttcaa attacgcttt tatttatcca catagcaaga aaataatact caaaatccaa 180 

cggtatcggt tattttatat tttactctac atgtatatat gtagtataat ggacataaat 240 

5 

tctgtcgtaa ttatacatat attaataatg aggattgtaa aataatatgc aaaaacgtcg 300 

tatttgacat actaatagct aaaatactac ctactatcat atataattag ttaactatgt 3 60 

10 gccttttaag aaaaattacg tgaaataaca aatatttaga gcatattatg taatatagct 42 0 

gtagttttat tattttttgt taatggctac aatttcgcaa aattttccta ttttgtttct 4 80 

taatcgtata aatccaaatt ttgtataatt atgaccttaa ttgtttaatt cagatttcgt 540 

15 

ataaaattcg atttttgatt ttataaatta aaatttatac ttactttagc tacttgttta 600 

tgatttatca aaaaattcat attaatctat ttgtatatgg acaagcaaaa tatacaaatg 660 

20 gagttctgaa aatttctaaa tgcatatact taatatcttt gatggtcact caactatcaa 720 

ctttttccat aaaaagtcac ttaacattga ttttcaactc gaaaatcact caactatgaa 780 

atctttgtat agaaagtcac tcaacctatt taattatttt tttccattat atctgttgtc 840 
25 ' 

acgaaatatt atttctaact aatattctaa gaataaacat acatccattt aaatcattta 90 0 

ataaacccgc ccacttgacc taacccacat aatattaaca cttttgtttt acttttattc 960 

30 tccaaaatta ttttcttggt ttcccattct ttctcctttg cttttttttt cttcttctca 1020 

atttcagcct ttttcttcct ttttttagta aacctcagtc aaataggaat tagattgtga 1080 

ttaaaatatt attagaagga tgcagggttg tacaaagaga gtttattaag agataatcta 114 0 

35 

taaaaaaaaa aaagtcagat aatgcatatt cagattcaga gatcattaaa tgatgacttt 1200 

tttcgtaata ggttttcttt aaatcctttc gccttcatac gacgactctc gataataaca 126 0 

40 tcgtttaaag ctaataatgc taatgaacaa taatcaaaat aaaaaagaat tcggatacaa 132 0 

gagaaaatga tttagtgaga gaaaaaattg agatattcct tattcctaac taaacgaagg 13 8 0 

aagaagaggc taaaattgag attcagttaa aaaaaaaaaa caaagaaaaa cgcaatggag 144 0 

45 

atgagagaaa gtaattttga aaaataaaaa taaattaaga gggtaaatat tttattttta 1500 

gcgagttggg ttaagtggtg ccggtcatta aatggatata tgtttatttc ttaaaatttt 1560 

50 agttagaaat acaaatttca aatcaacaaa ttttaatgaa aaaataatta aataggttga 162 0 



43 

gtggctttct atgcaaagat ctcatagttg agtgattttt gagtagaaaa tcatagttaa 1680 

gtgagtttct gtgaaaaaaa attgatagtt gagtgactat caaagatatt aactctagac 1740 

ttgtcatatt cgtatactta catacgaaat atacaaacct ctgcctccat gacaagcaaa 18 00 

aaactataac tatgaaacaa tattttcgaa atcatagcta taaagtctta ttatatctaa 1860 

tatctttact atttttaaaa atttcacata attttaatac ataaataatt tacttttaac 1920 

taacgaaaaa ggacattttt atgtcacctg agagcccatc ggtagattca tcacattttt 1980 

tcgtttcttg taataaactg tacacatata aggagaaatt aaattagaga ttatttttcc 2 040 

attttgagga gattaataaa tttaaaatgt aacttaacat gtaaactgct ataaaggtaa 210 0 

caaaacacgt aaactgctat aaaggtaatt ctatttaaaa gataaataaa tgcttaaaag 2160 

aagtgccaaa aaaacacaaa caaacaaatg aaactaaacc tacttcaagg gaagttcttg 2220 

tagtataaaa ataaataaag tcaacttatt cacgacattt ctttttggtt ttcttttggc 22 80 

tacgtattca tatttaagtc tgactaattt agattctcgc tatatataaa agattcaggg 2340 

gtggctcaac gcaattggag gcctagagca aaatttcaat tcgcggccta atatattata 2400 

tactttatat acctatttat tcaaaattta ttttttttac actatttaga tggaaattat 2460 

tagtacttaa tattgttttt tcagttatta gttttaggta aaattttatt aatacaacat 2520 

tgaaaaacat cctttaagtg agacaattat tatatgtatt gttaacatag tgctataagt 2580 

aataagtaaa taaatattaa ataaaaataa gagtaagaac catagaattt gacacaagaa 2 640 

gttgatgact tggtatacct cattttaaca tgcttgtact ttagtaatgc ttgaatctaa 2700 

aatttaaaaa gaaataaaaa agaatttgta atccactttt tccaacactt ttcactgtta 2760 

attcttattt ttaacatagt acaaaaaata ttaaaatgga taaaataatt tattttataa 2820 

aagattatat atatattttt ttatcatata taactaattt ttctataaaa atttaaacac 288 0 

ataatttaat tttaaaaaaa atttggggct ttggggccta agacaaaggc cttaaaggac 2940 

aaaacataga gccgcccctg aaaagatctc attcgaaaga aaatatgcat taccaatgat 300 0 

ttttcgtacc cagagctcaa aatcaaaatt gtactgttat ttttttaaaa aatttcatct 3060 

cagactaaat ggaatttttt tctttggtta acctgtttga tcaatctttt ggaatcagtt 312 0 
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aattttgaaa aataaattaa tgagaaataa tttgtatttg tccagcttat ttaagaatta 3180 

tttttgagca acaatttata tttagtcacg cttttaagtg tattttttaa aataaaatta 324 0 

5 

aggtattatt tgaaaaaatt acttttaaaa aaattgaatt aaattctgtt actcttatta 33 00 

tatactccta tataatttga ttgccaaaaa tatcaaacgt ttaatatttg aagttgatgt. 3360 

10 gagggattac ttcttgatta aattgtacta caatgtaata ttatcaaatt aaagctt 3417 

<210> 22 
15 <211> 1155 
<212> DNA 

<213> Haematococcus pluvialis 

20 

<220> 
25 <221> CDS 

<222> (6).. (995) 
<223> 

30 



45 



50 



98 



<400> 22 

gaagc atg cag eta gca gcg aca gta atg ttg gag cag ctt acc gga age 
35 Met Gin Leu Ala Ala Thr Val Met Leu Glu Gin Leu Thr Gly Ser 

15 10 15 

get gag gca etc aag gag aag gag aag gag gtt gca ggc age tet gac 
Ala Glu Ala Leu Lys Glu Lys Glu Lys Glu Val Ala Gly Ser Ser Asp 
40 20 25 30 

gtg ttg cgt aca tgg gcg acc cag tac teg ctt ccg tea gag gag tea 146 
Val Leu Arg Thr Trp Ala Thr Gin Tyr Ser Leu Pro Ser Glu Glu Ser 
35 40 45 



194 



gac gcg gcc cgc ccg gga ctg aag aat gcc tac aag cca cca cct tec 

Asp Ala Ala Arg Pro Gly Leu Lys Asn Ala Tyr Lys Pro Pro Pro Ser 

50 55 60 

50 gac aca aag ggc ate aca atg gcg eta get gtc ate ggc tec tgg gcc 242 
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Asp Thr Lys Gly He Thr Met Ala Leu Ala Val He Gly Ser Trp Ala 
65 70 75 

gca gtg ttc etc cac gec att ttt caa ate aag ctt ccg acc tec ttg 
5 Ala Val Phe Leu His Ala He Phe Gin He Lys Leu Pro Thr Ser Leu 
80 85 90 95 

gac cag ctg cac tgg ctg ccc gtg tea gat gec aca get cag ctg gtt 
Asp Gin Leu His Trp Leu Pro Val Ser Asp Ala Thr Ala Gin Leu Val 
10 100 105 HO 

age ggc age age age ctg ctg cac ate gtc gta gta ttc ttt gtc ctg 
Ser Gly Ser Ser Ser Leu Leu His He Val Val Val Phe Phe Val Leu 
115 120 125 

15 

gag ttc ctg tac aca ggc ctt ttt ate acc acg cat gat get atg cat 
Glu Phe Leu Tyr Thr Gly Leu Phe He Thr Thr His Asp Ala Met His 
130 135 140 

20 ggc acc ate gec atg aga aac agg cag ctt aat gac ttc ttg ggc aga 
Gly Thr He Ala Met Arg Asn Arg Gin Leu Asn Asp Phe Leu Gly Arg 
145 150 155 

gta tgc ate tec ttg tac gee tgg ttt gat tac aac atg ctg cac cgc 
25 Val Cys He Ser Leu Tyr Ala Trp Phe Asp Tyr Asn Met Leu His Arg 
160 165 170 175 

aag cat tgg gag cac cac aac cac act ggc gag gtg ggc aag gac cct 
Lys His Trp Glu His His Asn His Thr Gly Glu Val Gly Lys Asp Pro 
30 180 185 190 

gac ttc cac agg gga aac cct ggc att gtg ccc tgg ttt gee age ttc 
Asp Phe His Arg Gly Asn Pro Gly He Val Pro Trp Phe Ala Ser Phe 
195 200 205 

atg tec age tac atg teg atg tgg cag ttt gcg cgc etc gca tgg tgg 
Met Ser Ser Tyr Met Ser Met Trp Gin Phe Ala Arg Leu Ala Trp Trp 
210 215 220 

40 acg gtg gtc atg cag ctg ctg ggt gcg cca atg gcg aac ctg ctg gtg 
Thr Val Val Met Gin Leu Leu Gly Ala Pro Met Ala Asn Leu Leu Val 
225 230 235 

ttc atg gcg gee gcg ccc ate ctg tec gee ttc cgc ttg ttc tac ttt 
45 Phe Met Ala Ala Ala Pro He Leu Ser Ala Phe Arg Leu Phe Tyr Phe 
240 245 250 255 

ggc acg tac atg ccc cac aag cct gag cct ggc gee gcg tea ggc tct 
Gly Thr Tyr Met Pro His Lys Pro Glu Pro Gly Ala Ala Ser Gly Ser 
50 * 260 265 270 



290 



338 



386 



434 



482 



530 



578 



62 6 



674 



722 



770 



818 
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tea cca gec gtc atg aac tgg tgg aag teg cgc act age cag gcg tec 
Ser Pro Ala Val Met Asn Trp Trp Lys Ser Arg Thr Ser Gin Ala Ser 
275 280 285 

5 

gac ctg gtc age ttt ctg ace tgc tac cac ttc gac ctg cac tgg gag 
Asp Leu Val Ser Phe Leu Thr Cys Tyr His Phe Asp Leu His Trp Glu 
290 295 300 

10 cac cac cgc tgg ccc ttt gec ccc tgg tgg gag ctg ccc aac tgc cgc 
His His Arg Trp Pro Phe Ala Pro Trp Trp Glu Leu Pro Asn Cys Arg 
305 310 315 

cgc ctg tct ggc cga ggt ctg gtt cct gec tag ctggacacac tgcagtgggc 
15 Arg Leu Ser Gly Arg Gly Leu Val Pro Ala 
320 325 

cctgctgcca gctgggcatg caggttgtgg caggactggg tgaggtgaaa agetgeagge 
20 gctgctgccg gacacgctgc atgggctacc ctgtgtagct gccgccacta ggggaggggg 
tttgtagctg tegagcttge 

25 <210> 23 

<211> 329 

<212> PRT 

30 

<213> Haematococcus pluvialis 



866 

914 

962 

1015 

1075 
1135 
1155 



35 <400> 23 

Met Gin Leu Ala Ala Thr Val Met Leu Glu Gin Leu Thr Gly Ser Ala 
15 10 15 

40 

Glu Ala Leu Lys Glu Lys Glu Lys Glu Val Ala Gly Ser Ser Asp Val 
20 25 30 



45 Leu Arg Thr Trp Ala Thr Gin Tyr Ser Leu Pro Ser Glu Glu Ser Asp 
35 40 45 



Ala Ala Arg Pro Gly Leu Lys Asn Ala Tyr Lys Pro Pro Pro Ser Asp 
50 50 55 60 



rr uoouj 



47 



Thr Lys Gly lie Thr Met Ala Leu Ala Val lie Gly Ser Trp Ala Ala 
65 70 75 80 



Val Phe Leu His Ala lie Phe Gin lie Lys Leu Pro Thr Ser Leu Asp 
85 90 95 



Gin Leu His Trp Leu Pro Val Ser Asp Ala Thr Ala Gin Leu Val Ser 
100 105 110 



Gly Ser Ser Ser Leu Leu His lie Val Val Val Phe Phe Val Leu Glu 
115 120 125 



Phe Leu Tyr Thr Gly Leu Phe He Thr Thr His Asp Ala Met His Gly 
130 135 140 



Thr He Ala Met Arg Asn Arg Gin Leu Asn Asp Phe Leu Gly Arg Val 
145 150 155 160 



Cys He Ser Leu Tyr Ala Trp Phe Asp Tyr Asn Met Leu .His Arg Lys 
165 170 175 



His Trp Glu His His Asn His Thr Gly Glu Val Gly Lys Asp Pro Asp 
180 185 190 



Phe His Arg Gly Asn Pro .Gly He Val Pro Trp Phe Ala Ser Phe Met 
195 200 205 



Ser Ser Tyr Met Ser Met Trp Gin Phe Ala Arg Leu Ala Trp Trp Thr 
210 215 220 



Val Val Met Gin Leu Leu Gly Ala Pro Met Ala Asn Leu Leu Val Phe 
225 230 235 240 



Met Ala Ala Ala Pro He Leu Ser Ala Phe Arg Leu Phe Tyr Phe Gly 
245 250 255 
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Thr Tyr Met Pro His Lys Pro Glu Pro Gly Ala Ala Ser Gly Ser Ser 
260 265 270 



5 Pro Ala Val Met Asn Trp Trp Lys Ser Arg Thr Ser Gin Ala Ser Asp 
275 280 285 



Leu Val Ser Phe Leu Thr Cys Tyr His Phe Asp Leu His Trp Glu His 
10 290 295 300 

His Arg Trp Pro Phe Ala Pro Trp Trp Glu Leu Pro Asn Cys Arg Arg 
305 310 315 320 

15 

Leu Ser Gly Arg Gly Leu Val Pro Ala 
325 

20 

<210> 24 
<211> 1111 
25 <212> DNA 

<213> Haematococcus pluvialis 

30 

<220> 

<221> CDS 
35 <222> (4).. (951) 
<223> 



40 

<400> 24 

tgc atg eta gag gca etc aag gag aag gag aag gag gtt gca ggc age 
Met Leu Glu Ala Leu Lys Glu Lys Glu Lys Glu Val Ala Gly Ser 
x 5 10 . 15 

45 

tct gac gtg ttg cgt aca tgg gcg ace cag tac teg ctt ccg tea gaa 
Ser Asp Val Leu Arg Thr Trp Ala Thr Gin Tyr Ser Leu Pro Ser Glu 
20 25 30 

50 gag tea gac gcg gee cgc ccg gga ctg aag aat gee tac aag cca cca 



48 



96 



144 
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Glu Ser Asp Ala Ala Arg Pro Gly Leu Lys Asn. Ala Tyr Lys Pro Pro 



35 40 



45 



35 



gac cct gac ttc cac agg gga aac cct ggc att gtg ccc tgg ttt gcc 
Asp Pro Asp Phe His Arg Gly Asn Pro Gly lie Val Pro Trp Phe Ala 
180 185 190 



40 age ttc atg tec age tac atg teg atg tgg cag ttt geg cgc etc gca 
Ser Phe Met Ser Ser Tyr Met Ser Met Trp Gin Phe Ala Arg Leu Ala 
195 200 205 

tgg tgg acg gtg gtc atg cag ctg ctg ggt geg cca atg geg aac ctg 
45 Trp Trp Thr Val Val Met Gin Leu Leu Gly Ala Pro Met Ala Asn Leu 
210 215 220 

ctg gtg ttc atg geg gcc geg ccc ate ctg tec gcc ttc cgc ttg ttc 
Leu Val Phe Met Ala Ala Ala Pro He Leu Ser Ala Phe Arg Leu Phe 
50 22S 230 235 



192 



240 



cct tec gac aca aag ggc ate aca atg geg eta get gtc ate ggc tec 
5 Pro Ser Asp Thr Lys Gly He Thr Met Ala Leu Ala Val He Gly Ser 
50 55 SO 

tgg gcc gca gtg ttc etc cac gcc att ttt caa ate aag ctt ccg ace 
Trp Ala Ala Val Phe Leu His Ala He Phe Gin He Lys Leu Pro Thr 
10 * 65 70 75 

tec ttg gac cag ctg cac tgg ctg ccc gtg tea gat gcc aca get cag 288 
Ser Leu Asp Gin Leu His Trp Leu Pro Val Ser Asp Ala Thr Ala Gin 
80 85 90 95 

15 

ctg gtt age ggc age age age ctg ctg cac ate gtc gta gta ttc ttt 
Leu val Ser Gly Ser Ser Ser Leu Leu His He val val Val Phe Phe 
100 105 110 

20 gtc ctg gag ttc ctg tac aca ggc ctt ttt ate acc acg cat gat get 
Val Leu Glu Phe Leu Tyr Thr Gly Leu Phe He Thr Thr His Asp Ala 
115 120 12 5 

atg cat ggc acc ate gcc atg aga aac agg cag ctt aat gac ttc ttg 
25 Met His Gly Thr He Ala Met Arg Asn Arg Gin Leu Asn Asp Phe Leu 
130 135 140 

ggc aga gta tgc ate tec ttg tac gcc tgg ttt gat tac aac atg ctg 
Gly Arg Val Cys lie Ser Leu Tyr Ala Trp Phe Asp Tyr Asn Met Leu 
30 145 150 155 

cac cgc aag cat tgg gag cac cac aac cac act ggc gag gtg ggc aag 
His Arg Lys His Trp Glu His His Asn His Thr Gly Glu Val Gly Lys 
160 ~ * 165 170 175 



336 



384 



432 



480 



528 



576 



624 



672 



720 
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tac ttt ggc acg tac atg ccc cac aag cct gag cct ggc gcc gcg tea 
Tyr Phe Gly Thr Tyr Met Pro His Lys Pro Glu Pro Gly Ala Ala Ser 
240 245 250 255 



ggc tct tea cca gcc gtc atg aac tgg tgg aag teg cgc act age cag 
Gly Ser Ser Pro Ala Val Met Asn Trp Trp Lys Ser Arg Thr Ser Gin 
260 265 270 



10 gcg tec gac ctg gtc age ttt ctg ace tgc tac cac ttc gac ctg cac 
Ala Ser Asp Leu Val Ser Phe Leu Thr Cys Tyr His Phe Asp Leu His 
275 280 285 

tgg gag cac cac ego tgg ccc ttc gee ecc tgg tgg gag ctg ccc aac 
15 Trp Glu His His Arg Trp Pro Phe Ala Pro Trp Trp Glu Leu Pro Asn 
290 295 30° 

tgc cgc cgc ctg tct ggc cga ggt ctg gtt cct gcc tag ctggacacac 
Cys Arg Arg Leu Ser Gly Arg Gly Leu Val Pro Ala 
20 305 310 315 

tgcagtgggc cctgctgcca gctgggcatg caggttgtgg caggactggg tgaggtgaaa 
agetgeagge gctgctgccg gacacgttgc atgggetacc ctgtgtagct gccgccacta 
ggggaggggg tttgtagctg tegagcttge 



25 



768 

816 

864 

912 

961 

1021 
1081 

s 

1111 



30 



<210> 25 

<211> 315 

<212> PRT 

35 <213> Haematococcus pluvialis 



40 



<400> 25 

Met Leu Glu Ala Leu Lys Glu Lys Glu Lys Glu Val Ala Gly Ser Ser 
15 10 I 5 



45 Asp Val Leu Arg Thr Trp Ala Thr Gin Tyr Ser Leu Pro Ser Glu Glu 
20 25 30 



Ser Asp Ala Ala Arg Pro 



Gly Leu Lys Asn Ala Tyr Lys Pro Pro Pro 



50 35 40 45 



PF 53863 



51 



Ser Asp Thr Lys Gly He Thr Met Ala Leu Ala Val He Gly Ser Trp 
50 55 60 

5 

Ala Ala Val Phe Leu His Ala He Phe Gin He Lys Leu Pro Thr Ser 
65 70 75 80 

10 

Leu Asp Gin Leu His Trp Leu Pro Val Ser Asp Ala Thr Ala Gin Leu 
85 90 95 



15 Val Ser Gly Ser Ser Ser Leu Leu His He Val Val Val Phe Phe Val 
100 105 HO 



Leu Glu Phe Leu Tyr Thr Gly Leu Phe He Thr Thr His Asp Ala Met 
20 115 120 125 



His Gly Thr He Ala Met Arg Asn Arg Gin Leu Asn Asp Phe Leu Gly 
130 135 140 

25 

Arg Val Cys He Ser Leu Tyr Ala Trp Phe Asp Tyr Asn .Met Leu His 
145 150 155 160 

30 

Arg Lys His Trp Glu His His Asn His Thr Gly Glu Val Gly Lys Asp 
165 170 175 



35 Pro Asp Phe His Arg Gly Asn Pro Gly He Val Pro Trp Phe Ala Ser 
180 185 190 



Phe Met Ser Ser Tyr Met Ser Met Trp Gin Phe Ala Arg Leu Ala Trp 
40 195 200 205 



Trp Thr Val Val Met Gin Leu Leu Gly Ala Pro Met Ala Asn Leu Leu 
210 215 220 

45 

Val Phe Met Ala Ala Ala Pro He Leu Ser Ala Phe Arg Leu Phe Tyr 
225 230 235 240 



50 



PF 53863 



52 

Phe Gly Thr Tyr Met Pro His Lys Pro Glu Pro Gly Ala Ala Ser Gly 
245 250 255 



5 Ser Ser Pro Ala Val Met Asn Trp Trp Lys Ser Arg Thr Ser Gin Ala 
260 265 270 



Ser Asp Leu Val Ser Phe Leu Thr Cys Tyr His Phe Asp Leu His Trp 
10 275 280 285 



Glu His His Arg Trp Pro Phe Ala Pro Trp Trp Glu Leu Pro Asn Cys 
290 295 300 

15 

Arg Arg Leu Ser Gly Arg Gly Leu Val Pro Ala 
305 310 315 

20 

<210> 26 
<211> 1031 
25 <212> DNA 

<213> Haematococcus pluvial is • » 

30 

<220> 

<221> CDS 
35 <222> (6).. (1031) 
<223> 



40 

<400> 26 

gaagc atg cag eta gca gcg aca gta atg ttg gag cag ctt acc gga age 50 
Met Gin Leu Ala Ala Thr Val Met Leu Glu Gin Leu Thr Gly Ser 
1 5 10 15 

45 

get gag gca etc aag gag aag gag aag gag gtt gca ggc age tct gac 
Ala Glu Ala Leu Lys Glu Lys Glu Lys Glu Val Ala Gly Ser Ser Asp 
20 25 30 



s 



98 



50 gtg ttg cgt aca tgg gcg acc cag tac teg ctt ccg tea gag gag tea 



146 



PF 53863 



53 

Val Leu Arg Thr Trp Ala Thr Gin Tyr Ser Leu Pro Ser Glu Glu Ser 
35 40 45 

gac gcg gcc cgc ccg gga ctg aag aat gcc tac aag cca cca cct tec 
5 Asp Ala Ala Arg Pro Gly Leu Lys Asn Ala Tyr Lys Pro Pro Pro Ser 
50 55 60 

gac aca aag ggc ate aca atg gcg eta get gtc ate ggc tec tgg get 
Asp Thr Lys Gly lie Thr Met Ala Leu Ala Val He Gly Ser Trp Ala 
10 65 70 75 

gca gtg ttc etc cac gcc att ttt caa ate aag ctt ccg ace tec ttg 
Ala Val Phe Leu His Ala He Phe Gin He Lys Leu Pro Thr Ser Leu 
80 85 90 95 



15 



35 



aag cat tgg gag cac cac aac cac act ggc gag gtg ggc aag gac cct 
Lys His Trp Glu His His Asn His Thr Gly Glu Val Gly Lys Asp Pro 
180 185 190 



194 



242 



290 



gac cag ctg cac tgg ctg ccc gtg tea gat gcc aca get cag ctg gtt 33 8 

Asp Gin Leu His Trp Leu Pro Val Ser Asp Ala Thr Ala Gin Leu Val 
100 105 HO 



20 age ggc age age age ctg ctg cac ate gtc gta gta ttc ttt gtc ctg 386 
Ser Gly Ser Ser Ser Leu Leu His He Val Val Val Phe Phe Val Leu 
115 120 125 

gag ttc ctg tac aca ggc ctt ttt ate ace acg cat gat get atg cat 43 4 

25 Glu Phe Leu Tyr Thr Gly Leu Phe He Thr Thr His Asp Ala Met His ' 
130 135 140 

i 

ggc acc ate gcc atg aga aac agg cag ctt aat gac ttc ttg ggc aga 482 
Gly Thr He Ala Met Arg Asn Arg Gin Leu Asn Asp Phe Leu Gly Arg 
30 145 150 155 

gta tgc ate tec ttg tac gcc tgg ttt gat tac aac atg ctg cac cgc 53 0 

Val Cys He Ser Leu Tyr Ala Trp Phe Asp Tyr Asn Met Leu His Arg 
160 165 170 175 



578 



626 



40 gac ttc cac agg gga aac cct ggc att gtg ccc tgg ttt gcc age ttc 
Asp Phe His Arg Gly Asn Pro Gly He Val Pro Trp Phe Ala Ser Phe 
195 200 205 

atg tec age tac atg teg atg tgg cag ttt gcg cgc etc gca tgg tgg 674 
45 Met Ser Ser Tyr Met Ser Met Trp Gin Phe Ala Arg Leu Ala Trp Trp 
210 215 220 



acg gtg gtc atg cag ctg ctg ggt gcg cca atg gcg aac ctg ctg gtg 
Thr Val Val Met Gin Leu Leu Gly Ala Pro Met Ala Asn Leu Leu Val 
50 225 230 235 



722 



PF 53863 

54 

ttc atg gcg gcc gcg ccc ate ctg tec gec ttc cgc ttg ttc tac ttt 
Phe Met Ala Ala Ala Pro He Leu Ser Ala Phe Arg Leu Phe Tyr Phe 
240 245 250 255 

5 

ggc acg tac atg ccc cac aag cct gag cct ggc gcc gcg tea ggc tct 
Gly Thr Tyr Met Pro His Lys Pro Glu Pro Gly Ala Ala Ser Gly Ser 
260 265 270 

10 tea cca gcc gtc atg aac tgg tgg aag teg cgc act age cag gcg tec 
Ser Pro Ala Val Met Asn Trp Trp Lys Ser Arg Thr Ser Gin Ala Ser 
275 280 285 

gac ctg gtc age ttt ctg acc tgc tac cac ttc gac ctg cac tgg gag 
15 Asp Leu Val Ser Phe Leu Thr Cys Tyr His Phe Asp Leu His Trp Glu 
290 295 300 

cac cac cgc tgg ccc ttt gcc ccc tgg tgg gag ctg ccc aac tgc cgc 
His His Arg Trp Pro Phe Ala Pro Trp Trp Glu Leu Pro Asn Cys Arg 
20 305 310 315 

cgc ctg tct ggc cga ggt ctg gtt cct gcc gag caa aaa etc ate tea 
Arg Leu Ser Gly Arg Gly Leu Val Pro Ala Glu Gin Lys Leu He Ser 
320 325 330 335 



25 



30 



gaa gag gat ctg aat age tag 
Glu Glu Asp Leu Asn Ser 
340 



<210> 27 

<211> 341 

35 <212> PRT 

<213> Haematococcus pluvial is 



770 



818 



866 



914 



962 



1010 



1031 



40 

<400> 27 

Met Gin Leu Ala Ala Thr Val Met Leu Glu Gin Leu Thr Gly Ser Ala 
15 10 15 

45 

Glu Ala Leu Lys Glu Lys Glu Lys Glu Val Ala Gly Ser Ser Asp Val 
20 25 30 



50 



PF 53863 



55 

Leu Arg Thr Trp Ala Thr Gin Tyr Ser Leu Pro Ser Glu Glu Ser Asp 
35 40 45 



Ala Ala Arg Pro Gly Leu Lys Asn Ala Tyr Lys Pro Pro Pro Ser Asp 
50 55 60 



Thr Lys Gly He Thr Met Ala Leu Ala Val He Gly Ser Trp Ala Ala 
65 70 75 80 



Val Phe Leu His Ala He Phe Gin He Lys Leu Pro Thr Ser Leu Asp 
85 90 95 



Gin Leu His Trp Leu Pro Val Ser Asp Ala Thr Ala Gin Leu Val Ser 
100 105 HO 



Gly Ser Ser Ser Leu Leu His He Val Val Val Phe Phe Val Leu Glu 
115 120 125 



Phe Leu Tyr Thr Gly Leu Phe He Thr Thr His Asp Ala Met His Gly 
130 135 140 



Thr He Ala Met Arg Asn Arg Gin Leu Asn Asp Phe Leu Gly Arg Val 
145 150 155 160 



Cys He Ser Leu Tyr Ala Trp Phe Asp Tyr Asn Met Leu His Arg Lys 
165 170 175 



His Trp Glu His His Asn His Thr Gly Glu Val Gly Lys Asp Pro Asp 
180 185 190 



Phe His Arg Gly Asn Pro Gly He Val Pro Trp Phe Ala Ser Phe Met 
195 200 205 



Ser Ser Tyr Met Ser Met Trp Gin Phe Ala Arg Leu Ala Trp Trp Thr 
210 215 220 



Val Val Met Gin Leu Leu Gly Ala Pro Met Ala Asn Leu Leu Val Phe 
225 230 235 240 



PF 53863 



56 



Met Ala Ala Ala Pro lie Leu Ser Ala Phe Arg Leu Phe Tyr Phe Gly 
245 250 255 

5 

Thr Tyr Met Pro His Lys Pro Glu Pro Gly Ala Ala Ser Gly Ser Ser 
260 265 270 

10 

Pro Ala Val Met Asn Trp Trp Lys Ser Arg Thr Ser Gin Ala Ser Asp 
275 280 285 



15 Leu Val Ser Phe Leu Thr Cys Tyr His Phe Asp Leu His Trp Glu His 
290 295 300 



His Arg Trp Pro Phe Ala Pro Trp Trp Glu Leu Pro Asn Cys Arg Arg 
20 305 310 315 320 



Leu Ser Gly Arg Gly Leu Val Pro Ala Glu Gin Lys Leu lie Ser Glu 
325 330 335 

25 

Glu Asp Leu Asn Ser ■ 1 

340 

30 

<210> 28 
<211> 777 
35 <212> DNA 

<213> Arabidopsis thaliana 

40 

<220> 

< 2 2 1 > promoter 
45 <222> (1) . . (777) 
<223> 



50 



30 



<210> 29 

<211> 22 

<212> DNA 

35 <213> kuenstlich 



40 



57 

<400> 28 

gagctcactc actgatttcc attgcttgaa aattgatgat gaactaagat caatccatgt 60 

tagtttcaaa acaacagtaa ctgtggccaa cttagttttg aaacaacact aactggtcga 12 0 

5 

agcaaaaaga aaaaagagtt tcatcatata tctgatttga tggactgttt ggagttagga 18 0 

ccaaacatta tctacaaaca aagacttttc tcctaacttg tgattccttc ttaaacccta 24 0 

10 ggggtaatat tctattttcc aaggatcttt agttaaaggc aaatccggga aattattgta 3 00 

atcatttggg gaaacatata aaagatttga gttagatgga agtgacgatt aatccaaaca 360 

tatatatctc tttcttctta tttcccaaat taacagacaa aagtagaata ttggctttta 42 0 

15 

acaccaatat aaaaacttgc ttcacaccta aacacttttg tttactttag ggtaagtgca 480 

aaaagccaac caaatccacc tgcactgatt tgacgtttac aaacgccgtt aagtcgatgt 54 0 

20 ccgttgattt aaacagtgtc ttgtaattaa aaaaatcagt ttacataaat ggaaaattta 600 

tcacttagtt ttcatcaact tctgaactta cctttcatgg attaggcaat actttccatt 660 

tttagtaact caagtggacc ctttacttct tcaactccat ctctctcttt ctatttcact 720 
25 " f 

tctttcttct cattatatct cttgtcctct ccaccaaatc tcttcaacaa aaagctt 777 



<220> 

<221> primer_bind 

<222> (1) . . (22) 
45 <223> 



<400> 29 

50 gcaagctcga cagctacaaa cc 22 



PF 53863 



58 



<210> 30 
5 <211> 24 
<212> DNA 



10 



20 



<213> kuenstlich 



<220> 

15 <221> primer_bind 
<222> (1)..(24) 



<223> 



25 



30 



35 



40 



45 



<400> 30 

gaagcatgca gctagcagcg acag 



<210> 31 



24 



<211> 30 

<212> DNA 

<213> kuenstlich 



<220> 

<221> primer_bind 

<222> (1) . . (30) 
<223> 



<400> 31 

tgcatgctag aggcactcaa ggagaaggag 



30 



50 



PF 53863 



59 

<210> 32 

<211> 59 

<212> DNA 

<213> kuenstlich 



<220> 

<221> primer_bind 
<222> (1) . . (59) 
<223> 



<400> 32 

ctagctattc agatcctctt ctgagatgag tttttgctcg gcaggaacca gacctcggc 



<210> 33 

<211> 28 

<212> DNA 

<213> kuenstlich. 



<220> 

<221> primer_bind 

<222> (1)..(28) 
<223> 



<400> 33 

gagctcactc actgatttcc attgcttg 



<210> 34 



PF 53863 



60 

<211> 37 

<212> DNA 

<213> kuenstlich 

<220> 

<221> primer_bind 

<222> (1) . . (37) 
<223> 

<400> 34 

cgccgttaag tcgatgtccg ttgattfcaaa cagtgtc 

<210> 35 

<211> 34 

<212> DNA 

<213> kuenstlich 

<220> 

<221> primer__bind 

<222> (1)..(34) 
<223> 

<400> 35 

atcaacggac atcgacttaa cggcgtttgt aaac 

<210> 36 
<211> 25 



PF 53863 



5 



10 



61 

<212> DNA 

<213> kuenstlich 



<220> 

<221> primer Jbind 

<222> (1)..(25) 
<223> 



15 



<400> 36 

taagcttttt gttgaagaga tttgg 



20 



<210> 37 
<211> 831 
25 <212> DNA 

<213> Haematococcus pluvialis ■ • 

30 

<220> 
<221> CDS 
35 <222> (1)..(831) 
<223> 

40 

<400> 37 

atg cca tec gag teg tea gac gca get cgt cct gtg ttg aag cac gee 
Met Pro Ser Glu Ser Ser Asp Ala Ala Arg Pro Val Leu Lys His Ala 
15 10 15 

45 

tat aaa cct cca gca tct gac gee aag ggc ate act atg gcg ctg acc 
Tyr Lys Pro Pro Ala Ser Asp Ala Lys Gly lie Thr Met Ala Leu Thr 
20 25 30 

50 ate att ggc acc tgg acc gca gtg ttt tta cac gca ata ttc caa ate 



PF 53863 



62 

He He Gly Thr Trp Thr Ala Val Phe Leu His Ala He Phe Gin He 
35 40 45 

agg eta ccg aca tec atg gac cag ctt cac tgg ttg cct gtg tec gaa 
5 Arg Leu Pro Thr Ser Met Asp Gin Leu His Trp Leu Pro Val Ser Glu 
50 55 60 

gec aca gec cag ctg ttg ggc gga age age age eta ttg cac ate gee 
Ala Thr Ala Gin Leu Leu Gly Gly Ser Ser Ser Leu Leu His He Ala 
10 65 70 75 80 

gca gtc ttc att gta ctt gag ttt ctg tac act ggt eta ttc ate acc 288 
Ala Val Phe He Val Leu Glu Phe Leu Tyr Thr Gly Leu Phe He Thr 
85 90 95 



15 



35 



192 



240 



acg cat gat gca atg cat ggc acc ata get ttg agg aac agg cag etc 33 6 

Thr His Asp Ala Met His Gly Thr He Ala Leu Arg Asn Arg Gin Leu 
100 105 HO 

20 aat gat etc ctt ggc aac ate tgc ata tea ctg tac gee tgg ttt gac 384 
Asn Asp Leu Leu Gly Asn He Cys He Ser Leu Tyr Ala Trp Phe Asp 
115 120 125 

tac age atg cac tgg gag cac cac aac cat act ggc gaa gtg ggg aaa 432 
25 Tyr Ser Met His Trp Glu His His Asn His Thr Gly Glu Val Gly Lys ' 
130 135 140 

. « 

gac cct gac ttc cac aaa gga aat cct ggc ctt gtc ccc tgg ttc gee 480 
Asp Pro Asp Phe His Lys Gly Asn Pro Gly Leu Val Pro Trp Phe Ala 
30 145 150 155 160 

age ttc atg tec age tac atg tec ctg tgg cag ttt gee egg ctg gca 528 
Ser Phe Met Ser Ser Tyr Met Ser Leu Trp Gin Phe Ala Arg Leu Ala 
165 170 175 



tgg tgg gca gtg gtg atg caa acg ttg ggg gee ccc atg gcg aat etc 57 6 

Trp Trp Ala Val Val Met Gin Thr Leu Gly Ala Pro Met Ala Asn Leu 
180 185 190 

40 eta gtc ttc atg get gca gee cca ate ttg tea gca ttc cgc etc ttc 624 
Leu Val Phe Met Ala Ala Ala Pro He Leu Ser Ala Phe Arg Leu Phe 
195 200 205 

tac ttc ggc act tac ctg cca cac aag cct gag cca ggc cct gca gca 672 
45 Tyr Phe Gly Thr Tyr Leu Pro His Lys Pro Glu Pro Gly Pro Ala Ala 
210 215 220 



ggc tct cag gtc atg tct tgg ttc agg gee aag aca agt gag gca tct 
Gly Ser Gin Val Met Ser Trp Phe Arg Ala Lys Thr Ser Glu Ala Ser 
50 225 230 235 240 



720 



PF 53863 



63 

gat gtg atg age ttc ctg aca tgc tac cac ttt gac ctg ttt gec ccc 
Asp Val Met Ser Phe Leu Thr Cys Tyr His Phe Asp Leu Phe Ala Pro 
245 250 255 

5 

tgg tgg cag ctg ccc cac tgc cgc cgc ctg tct ggg cgt ggc ctg gtg 
Trp Trp Gin Leu Pro His Cys Arg Arg Leu Ser Gly Arg Gly Leu Val 
260 265 270 

10 cct gec ttg gca tga 
Pro Ala Leu Ala 
275 



15 <210> 38 
<211> 276 
<212> PRT 

20 

<213> Haematococcus pluvialis 
25 <400> 38 

Met Pro Ser Glu Ser Ser Asp Ala Ala Arg Pro Val Leu 'Lys His Ala 
15 10 I 5 

30 

Tyr Lys Pro Pro Ala Ser Asp Ala Lys Gly lie Thr Met Ala Leu Thr 
20 25 30 



35 lie lie Gly Thr Trp Thr Ala Val Phe Leu His Ala lie Phe Gin He 
35 40 45 



Arg Leu Pro Thr Ser Met Asp Gin Leu His Trp Leu Pro Val Ser Glu 
40 50 55 60 



Ala Thr Ala Gin Leu Leu Gly Gly Ser Ser Ser Leu Leu His He Ala 
65 70 75 80 

45 

Ala Val Phe He Val Leu Glu Phe Leu Tyr Thr Gly Leu Phe He Thr 
85 90 95 



768 



816 



831 



50 



PF 53863 



64 

Thr His Asp Ala Met His Gly Thr lie Ala Leu Arg Asn Arg Gin Leu 
100 105 HO 



5 Asn Asp Leu Leu Gly Asn lie Cys He Ser Leu Tyr Ala Trp Phe Asp 
115 120 125 



Tyr Ser Met His Trp Glu His His Asn His Thr Gly Glu Val Gly Lys 
10 130 135 140 



Asp Pro Asp Phe His Lys Gly Asn Pro Gly Leu Val Pro Trp Phe Ala 
145 150 155 160 

15 

Ser Phe Met Ser Ser Tyr Met Ser Leu Trp Gin Phe Ala Arg Leu Ala 
165 170 175 

20 

Trp Trp Ala Val Val Met Gin Thr Leu Gly Ala Pro Met Ala Asn Leu 
180 185 190 



25 Leu Val Phe Met Ala Ala Ala Pro He Leu Ser Ala Phe Arg Leu Phe 
195 200 205 



Tyr Phe Gly Thr Tyr Leu Pro His Lys Pro Glu Pro Gly Pro Ala Ala 
30 210 215 220 



Gly Ser Gin Val Met Ser Trp Phe Arg Ala Lys Thr Ser Glu Ala Ser 
225 230 235 240 

35 

Asp Val Met Ser Phe Leu Thr Cys Tyr His Phe Asp Leu Phe Ala Pro 
245 250 255 

40 

Trp Trp Gin Leu Pro His Cys Arg Arg Leu Ser Gly Arg Gly Leu Val 
260 265 270 



45 Pro Ala Leu Ala 
275 



<210> 39 

50 



PF 53863 



65 

<211> 729 
<212> DNA 
5 <213> Paracoccus sp. MBIC1143 



<220> 

10 

<221> CDS 
<222> (1) . . (729) 
15 <223> 



<400> 39 

20 atg age gca cat gec ctg ccc aag gca gat ctg acc gec acc age ctg 
Met Ser Ala His Ala Leu Pro Lys Ala Asp Leu Thr Ala Thr Ser Leu 
15 10 15 

ate gtc teg ggc ggc ate ate gec get tgg ctg gee ctg cat gtg cat 
25 lie Val Ser Gly Gly lie lie Ala Ala Trp Leu Ala Leu His Val His 
20 25 30 

gcg ctg tgg ttt ctg gac gca gcg gcg cat ccc ate ctg gcg ate gca 
Ala Leu Trp Phe Leu Asp Ala Ala Ala His Pro lie Leu Ala lie Ala 
30 35 40 45 

aat ttc ctg ggg ctg acc tgg ctg teg gtc gga ttg ttc ate ate gcg 
Asn Phe Leu Gly Leu Thr Trp Leu Ser Val Gly Leu Phe lie He Ala 
50 55 60 



35 



48 



96 



65 70 



75 80 



40 gcg gcg atg ggc cag ctt gtc ctg tgg ctg tat gee gga ttt teg tgg 
Ala Ala Met Gly Gin Leu Val Leu Trp Leu Tyr Ala Gly Phe Ser Trp 
85 90 95 

cgc aag atg ate gtc aag cac atg gee cat cac cgc cat gee gga acc 
45 Arg Lys Met He Val Lys His Met Ala His His Arg His Ala Gly Thr 
100 105 11° 



144 



192 



cat gac gcg atg cac ggg teg gtg gtg ccg ggg cgt ccg cgc gee aat 240 
His Asp Ala Met His Gly Ser Val Val Pro Gly Arg Pro Arg Ala Asn 



288 



336 



gac gac gac ccc gat ttc gac cat ggc ggc ccg gtc cgc tgg tac gec 
Asp Asp Asp Pro Asp Phe Asp His Gly Gly Pro Val Arg Trp Tyr Ala 
50 H5 120 125 



384 



PF 53863 



66 

cgc ttc ate ggc acc tat ttc ggc tgg cgc gag ggg ctg ctg ctg ccc 
Arg Phe He Gly Thr Tyr Phe Gly Trp Arg Glu Gly Leu Leu Leu Pro 
130 135 140 

gtc ate gtg acg gtc tat gcg ctg ate ctt ggg gat cgc tgg atg tac 
Val He Val Thr Val Tyr Ala Leu He Leu Gly Asp Arg Trp Met Tyr 
145 150 155 160 

gtg gtc ttc tgg ccg ctg ccg teg ate ctg gcg teg ate cag ctg ttc 
Val Val Phe Trp Pro Leu Pro Ser He Leu Ala Ser He Gin Leu Phe 
165 170 175 

gtg ttc ggc acc tgg ctg ccg cac cgc ccc ggc cac gac gcg ttc ccg 
Val Phe Gly Thr Trp Leu Pro His Arg Pro Gly His Asp Ala Phe Pro 
180 185 190 

gac cgc cac aat gcg egg teg teg egg ate age gac ccc gtg teg ctg 
Asp Arg His Asn Ala Arg Ser Ser Arg He Ser Asp Pro Val Ser Leu 
195 200 205 

ctg acc tgc ttt cac ttt ggc ggt tat cat cac gaa cac cac ctg cac 
Leu Thr Cys Phe His Phe Gly Gly Tyr His His Glu His His Leu His 
210 215 220 

ccg acg gtg ccg tgg tgg cgc ctg ccc age acc cgc acc aag ggg gac 
Pro Thr Val Pro Trp Trp Arg Leu Pro Ser Thr Arg Thr iLys Gly Asp 
225 230 235 240 

acc gca tga 
Thr Ala 



<210> 40 

<211> 242 

<212> PRT 

<213> Paracoccus sp. MBIC1143 



<400> 40 



Met Ser Ala His Ala Leu Pro Lys Ala Asp Leu Thr Ala Thr Ser Leu 
15 10 15 



PP 53863 



67 

He Val Ser Gly Gly He He Ala Ala Trp Leu Ala Leu His Val His 
20 25 30 



5 Ala Leu Trp Phe Leu Asp Ala Ala Ala His Pro He Leu Ala He Ala 
35 40 45 



Asn Phe Leu Gly Leu Thr Trp Leu Ser Val Gly Leu Phe He He Ala 
10 50 55 60 



His Asp Ala Met His Gly Ser Val Val Pro Gly Arg Pro Arg Ala Asn 
65 70 75 80 

15 

Ala Ala Met Gly Gin Leu Val Leu Trp Leu Tyr Ala Gly Phe Ser Trp 
85 90 95 

20 

Arg Lys Met He Val Lys His Met Ala His His Arg His Ala Gly Thr 
100 105 110 



25 Asp Asp Asp Pro Asp Phe Asp His Gly Gly Pro Val Arg Trp Tyr Ala ' 
115 120 125 



Arg Phe He Gly Thr Tyr Phe Gly Trp Arg Glu Gly Leu Leu Leu Pro 
30 130 135 140 



Val He Val Thr Val Tyr Ala Leu He Leu Gly Asp Arg Trp Met Tyr 
145 150 155 160 

35 

Val Val Phe Trp Pro Leu Pro Ser He Leu Ala Ser He Gin Leu Phe 
165 170 175 

40 

Val Phe Gly Thr Trp Leu Pro His Arg Pro Gly His Asp Ala Phe Pro 
180 185 190 



45 Asp Arg His Asn Ala Arg Ser Ser Arg He Ser Asp Pro Val Ser Leu 
195 200 205 



Leu Thr Cys Phe His Phe Gly Gly Tyr His His Glu His His Leu His 
50 210- 215 220 



PF 53863 



68 



Pro Thr Val Pro Trp Trp Arg Leu Pro Ser Thr Arg Thr Lys Gly Asp 
225 230 235 240 



10 



15 



Thr Ala 

<210> 41 
<211> 735 
<212> DNA 



20 



<213> Brevundimonas aurantiaca 



<220> 



<221> CDS 
25 <222> (1)..(735) 
<223> 



30 



35 



40 



<400> 41 

atg acc gcc gcc gtc gcc gag cca cgc acc gtc ccg cgc cag acc tgg 

Met Thr Ala Ala Val Ala Glu Pro Arg Thr Val Pro Arg Gin Thr Trp 
15 10 15 

ate ggt ctg acc ctg gcg gga atg ate gtg gcg gga tgg gcg gtt ctg 
lie Gly Leu Thr Leu Ala Gly Met lie Val Ala Gly Trp Ala Val Leu 
20 25 30 

cat gtc tac ggc gtc tat ttt cac cga tgg ggg ccg ttg acc ctg gtg 
His Val Tyr Gly Val Tyr Phe His Arg Trp Gly Pro Leu Thr Leu Val 
35 40 45 



ate gcc ccg gcg ate gtg gcg gtc cag acc tgg ttg teg gtc ggc ctt 
45 He Ala Pro Ala He Val Ala Val Gin Thr Trp Leu Ser Val Gly Leu 
50 55 60 



48 



96 



144 



192 



50 



ttc ate gtc gcc cat gac gcc atg tac ggc tec ctg gcg ccg gga egg 
Phe He Val Ala His Asp Ala Met Tyr Gly Ser Leu Ala Pro Gly Arg 
65 70 75 80 



240 



PF 53863 



69 

ccg egg ctg aac gec gca gtc ggc egg ctg acc ctg ggg etc tat gcg 288 
Pro Arg Leu Asn Ala Ala Val Gly Arg Leu Thr Leu Gly Leu Tyr Ala 
85 90 95 

5 

ggc ttc cgc ttc gat egg ctg aag acg gcg cac cac gee cac cac gee 33 6 

Gly Phe Arg Phe Asp Arg Leu Lys Thr Ala His His Ala His His Ala 
100 105 110 

10 gcg ccc ggc acg gee gac gac ccg gat ttt cac gee ccg gcg ccc cgc 384 
Ala Pro Gly Thr Ala Asp Asp Pro Asp Phe His Ala Pro Ala Pro Arg 
115 120 125 

gec ttc ctt ccc tgg ttc ctg aac ttc ttt cgc acc tat ttc ggc tgg 432 
15 Ala Phe Leu Pro Trp Phe Leu Asn Phe Phe Arg Thr Tyr Phe Gly Trp 
130 135 140 

cgc gag atg gcg gtc ctg acc gee ctg gtc ctg ate gec etc ttc ggc 480 
Arg Glu Met Ala Val Leu Thr Ala Leu Val Leu lie Ala Leu Phe Gly 
20 145 150 155 160 

ctg ggg gcg egg ccg gec aat etc ctg acc ttc tgg gee gcg ccg gec 528 
Leu Gly Ala Arg Pro Ala Asn Leu Leu Thr Phe Trp Ala Ala Pro Ala 
165 170 175 

25 

ctg ctt tea gcg ctt cag etc ttc acc ttc ggc acc tgg ctg ccg cac 576 
Leu Leu Ser Ala Leu Gin Leu Phe Thr Phe Gly Thr Trp* Leu Pro His 
180 185 190 

30 cgc cac acc gac cag ccg ttc gec gac gcg cac cac gee cgc age age 624 
Arg His Thr Asp Gin Pro Phe Ala Asp Ala His His Ala Arg Ser Ser 
195 200 205 

ggc tac ggc ccc gtg ctt tec ctg etc acc tgt ttc cac ttc ggc cgc 672 
35 Gly Tyr Gly Pro Val Leu Ser Leu Leu Thr Cys Phe His Phe Gly Arg 
210 215 220 

cac cac gaa cac cat ctg age ccc tgg egg ccc tgg tgg cgt ctg tgg 720 
His His Glu His His Leu Ser Pro Trp Arg Pro Trp Trp Arg Leu Trp 
40 225 230 235 240 



cgc ggc gag tct tga 
Arg Gly Glu Ser 



735 



45 



<210> 42 



<211> 244 

50 



PF 53863 

<212> PRT 



70 



<213> Brevundimonas aurantiaca 

5 

<400> 42 

Met Thr Ala Ala Val Ala Glu Pro Arg Thr Val Pro Arg Gin Thr Trp 
10 1 5 10 15 

lie Gly Leu Thr Leu Ala Gly Met lie Val Ala Gly Trp Ala Val Leu 
20 25 30 

15 

His Val Tyr Gly Val Tyr Phe His Arg Trp Gly Pro Leu Thr Leu Val 
35 40 45 

20 

He Ala Pro Ala He Val Ala Val Gin Thr Trp Leu Ser Val Gly Leu 
50 55 60 



25 Phe He Val Ala His Asp Ala Met Tyr Gly Ser Leu Ala Pro Gly Arg 
65 70 75 80 



Pro Arg Leu Asn Ala Ala Val Gly Arg Leu Thr Leu Gly Leu Tyr Ala 
30 85 90 95 



Gly Phe Arg Phe Asp Arg Leu Lys Thr Ala His His Ala His His Ala 
100 105 11° 

35 

Ala Pro Gly Thr Ala Asp Asp Pro Asp Phe His Ala Pro Ala Pro Arg 
115 120 125 

40 

Ala Phe Leu Pro Trp Phe Leu Asn Phe Phe Arg Thr Tyr Phe Gly Trp 
130 135 140 



45 Arg Glu Met Ala Val Leu Thr Ala Leu Val Leu He Ala Leu Phe Gly 
145 150 155 160 



Leu Gly Ala Arg Pro Ala Asn Leu Leu Thr Phe Trp Ala Ala Pro Ala 
50 165 170 175 
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71 



Leu Leu Ser Ala Leu Gin Leu Phe Thr Phe Gly Thr Trp Leu Pro His 
180 185 190 

5 

Arg His Thr Asp Gin Pro Phe Ala Asp Ala His His Ala Arg Ser Ser 
195 200 205 

10 

Gly Tyr Gly Pro Val Leu Ser Leu Leu Thr Cys Phe His Phe Gly Arg 
210 215 220 



15 His His Glu His His Leu Ser Pro Trp Arg Pro Trp Trp Arg Leu Trp 
225 230 235 240 



Arg Gly Glu Ser 

20 



<210> 43 
25 <211> 690 
<212> DNA 

<213> Nodularia spumigena NSOR10 

30 

<220> 
35 <221> CDS 

<222> (1) . . (690) 
<223> 

40 



<400> 43 

atg gcg ate gec att att agt ata tgg get ate age eta ggt ttg tta 4 8 

45 Met Ala lie Ala He He Ser He Trp Ala He Ser Leu Gly Leu Leu 
15 10 15 



ctt tat att gat ata tec caa ttc aag ttt tgg atg ttg tta'ccg etc 
Leu Tyr He Asp He Ser Gin Phe Lys Phe Trp Met Leu Leu Pro Leu 
50 20 25 30 



96 
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72 

ata ttt tgg caa aca ttt tta tat acg gga tta ttt att aca get cat 

lie Phe Trp Gin Thr Phe Leu Tyr Thr Gly Leu Phe lie Thr Ala His 
35 40 45 

gat gec atg cat ggg gta gtt ttt ccc aaa aat ccc aaa ate aac cat 
Asp Ala Met His Gly Val Val Phe Pro Lys Asn Pro Lys He Asn His 
50 55 60 

ttc att ggc tea ttg tgc ctg ttt ctt tat ggt ctt tta cct tat caa 
Phe He Gly Ser Leu Cys Leu Phe Leu Tyr Gly Leu Leu Pro Tyr Gin 
65 70 75 80 

aaa ctt tta aaa aag cat tgg eta cat cac cat aat cca gec agt gaa 
Lys Leu Leu Lys Lys His Trp Leu His His His Asn Pro Ala Ser Glu 
85 90 95 

aca gat cca gat ttt cac aac ggg aag cag aaa aac ttt ttt get tgg 
Thr Asp Pro Asp Phe His Asn Gly Lys Gin Lys Asn Phe Phe Ala Trp 
100 X05 110 

tat tta tat ttt atg aag cgt tac tgg agt tgg tta caa att ate aca 
Tyr Leu Tyr Phe Met Lys Arg Tyr Trp Ser Trp Leu Gin He lie Thr 
115 120 125 

tta atg att att tat aac tta eta aaa tat ata tgg cat ttt cca gag 
Leu Met lie He Tyr Asn Leu Leu Lys Tyr He Trp His • Phe Pro Glu 
130 135 140 

gat aat atg act tat ttt tgg gta gtt ccc tea att tta agt tct tta 
Asp Asn Met Thr Tyr Phe Trp Val Val Pro Ser He Leu Ser Ser Leu 
145 150 155 160 

caa tta ttt tat ttt gga act ttt eta ccc cac agt gag cct gta gaa 
Gin Leu Phe Tyr Phe Gly Thr Phe Leu Pro His Ser Glu Pro Val Glu 
165 170 175 

ggt tat aaa gag cct cat cgt tec caa act att age cgt ccc att tgg 
Gly Tyr Lys Glu Pro His Arg Ser Gin Thr He Ser Arg Pro He Trp 
180 185 190 

tgg tea ttt ata act tgt tac cat ttt ggt tat cat tac gaa cat cat 
Trp Ser Phe He Thr Cys Tyr His Phe Gly Tyr His Tyr Glu His His 
195 200 205 

gaa tac ccc cat gtt cct tgg tgg caa tta cca gaa att tat aaa atg 
Glu Tyr Pro His Val Pro Trp Trp Gin Leu Pro Glu He Tyr Lys Met 
210 215 220 



tct aaa tea aat ttg tga 



Ser Lys Ser Asn Leu 
225 



73 



<210> 44 

<211> 229 

<212> PRT 

<213> Nodularia spumigena NSOR10 

<400> 44 



Met Ala He Ala He He Ser He Trp Ala He Ser Leu Gly Leu Leu 
15 10 15 



Leu Tyr He Asp He Ser Gin Phe Lys Phe Trp Met Leu Leu Pro Leu 
20 25 30 



He Phe Trp Gin Thr Phe Leu Tyr Thr Gly Leu Phe He Thr Ala Hia 
3 5 40 45 



Asp Ala Met His Gly Val val Phe Pro Lys Asn Pro Lys He Asn His 
50 55 60 



Phe He Gly Ser Leu Cys Leu Phe Leu Tyr Gly Leu Leu Pro Tyr Gin 
65 70 75 80 



Lys Leu Leu Lys Lys His Trp Leu His His His Asn Pro Ala Ser Glu 
85 90 95 



Thr Asp Pro Asp Phe His Asn Gly Lys Gin Lys Asn Phe Phe Ala Trp 
100 105 no 



Tyr Leu Tyr Phe Met Lys Arg Tyr Trp Ser Trp Leu Gin He He Thr 
115 120 125 



Leu Met He He Tyr Asn Leu Leu Lys Tyr He Tro His Phe Pro Glu 
130 135 140 
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Asp Asn Met Thr Tyr Phe Trp Val Val Pro Ser lie Leu Ser Ser Leu 
"5 150 155 160 



Gin Leu Phe Tyr Phe Gly Thr Phe Leu Pro His Ser Glu Pro Val Glu 
165 170 175 



Gly Tyr Lys Glu Pro His Arg Ser Gin Thr lie Ser Arg Pro lie Trp 
180 185 190 



Trp Ser Phe lie Thr Cys Tyr His Phe Gly Tyr His Tyr Glu His His 
195 200 205 



Glu Tyr Pro His Val Pro Trp Trp Gin Leu Pro Glu He Tyr Lys Met 
210 215 220 



Ser Lys Ser Asn Leu 
225 



<210> 45 

<211> 789 

<212> DNA 

<213> Nostoc punctiforme ATCC 2 9133 
<220> 

<221> CDS 

<222> (1)..<789) 

<223> 



<400> 45 

ttg aat ttt tgt gat aaa cca gtt age tat tat gtt gca ata gag caa 

Leu Asn Phe Cys Asp Lys Pro Val Ser Tyr Tyr Val Ala He Glu Gin 
15 io 15 



rr soooj 



25 



75 

tta agt get aaa gaa gat act gtt tgg ggg ctg gtg att gtc ata gta 96 
Leu Ser Ala Lys Glu Asp Thr Val Trp Gly Leu Val He Val He Val 
20 25 30 

att att agt ctt tgg gta get agt ttg get ttt tta eta get att aat 144 
He He Ser Leu Trp Val Ala Ser Leu Ala Phe Leu Leu Ala He Asn 
35 40 45 



10 tat gee aaa gtc cca att tgg ttg ata cct att gca ata gtt tgg caa 
Tyr Ala Lys Val Pro He Trp Leu He Pro He Ala He Val Trp Gin 
50 55 60 

atg ttc ctt tat aca ggg eta ttt att act gca cat gat get atg cat 
15 Met Phe Leu Tyr Thr Gly Leu Phe He Thr Ala His Asp Ala Met His 
65 70 75 80 

ggg tea gtt tat cgt aaa aat ccc aaa att aat aat ttt ate ggt tea 
Gly Ser Val Tyr Arg Lys Asn Pro Lys He Asn Asn Phe He Gly Ser 
20 85 90 95 

eta get gta gcg ctt tac get gtg ttt cca tat caa cag atg tta aag 
Leu Ala Val Ala Leu Tyr Ala Val Phe Pro Tyr Gin Gin Met Leu Lys 
100 105 HO 



45 



192 



240 



288 



336 



aat cat tgc tta cat cat cgt cat cct get age gaa gtt gac cca gat 384 
Asn His Cys Leu His His Arg His Pro Ala Ser Glu Val .Asp Pro Asp 
115 120 125 



30 ttt cat gat ggt aag aga aca aac get att ttc tgg tat etc cat ttc 43 2 

Phe His Asp Gly Lys Arg Thr Asn Ala He Phe Trp Tyr Leu His Phe 
130 135 140 

atg ata gaa tac tec agt tgg caa cag tta ata gta eta act ate eta 480 
35 Met He Glu Tyr Ser Ser Trp Gin Gin Leu He Val Leu Thr He Leu 
145 150 155 160 

ttt aat tta get aaa tac gtt ttg cac ate cat caa ata aat etc ate 528 
Phe Asn Leu Ala Lys Tyr Val Leu His He His Gin He Asn Leu He 
40 165 170 175 

tta ttt tgg agt att cct cca att tta agt tec att caa ctg ttt tat 576 
Leu Phe Trp Ser He Pro Pro He Leu Ser Ser He Gin Leu Phe Tyr 
180 185 190 



ttc gga aca ttt ttg cct cat cga gaa ccc aag aaa gga tat gtt tat 624 
Phe Gly Thr Phe Leu Pro His Arg Glu Pro Lys Lys Gly Tyr Val Tyr 
195 200 205 



50 ccc cat tgc age caa aca ata aaa ttg cca act ttt ttg tea ttt ate 



672 
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Pro His Cys Ser Gin Thr lie Lys Leu Pro Thr Phe Leu Ser Phe lie 
210 215 220 

get tgc tac cac ttt ggt tat cat gaa gaa cat cat gag tat ccc cat 
5 Ala Cys Tyr His Phe Gly Tyr His Glu Glu His His Glu Tyr Pro His 

tic 240 
225 230 235 

gta cct tgg tgg caa ctt cca tct gta tat aag cag aga gta ttc aac 
val Pro Trp Trp Gin Leu Pro Ser Val Tyr Lys Gin Arg Val Phe Asn 



10 245 250 

aat tea gta acc aat teg taa 
Asn Ser Val Thr Asn Ser 
260 

15 

<210> 46 
<211> 262 

20 

<212> PRT 

<213> Nostoc punctiforme ATCC 29133 

25 

<400> 46 



255 



720 



768 



789 



Leu Asn Phe Cys Asp Lys Pro Val Ser Tyr Tyr val Ala He Glu Gin 
30 l 5 



10 15 



Leu Ser Ala Lys Glu Asp Thr Val Trp Gly Leu Val He Val He Val 

35 



20 25 30 



He He Ser Leu Trp Val Ala Ser Leu Ala Phe Leu Leu Ala He Asn 
35 40 45 

40 

Tyr Ala Lys Val Pro He Trp Leu He Pro He Ala He Val Trp Gin 
50 " 55 60 



45 Met Phe Leu Tyr Thr Gly Leu Phe He Thr Ala His Asp Ala Met Hxs 
65 70 75 80 



Gly ser Val Tyr Arg Lys Asn Pro Lys He Asn Asn Phe He Gly Ser 
50 ^ 85 90 95 



r*r ooooo 



77 



Leu Ala Val Ala Leu Tyr Ala Val Phe Pro Tyr Gin Gin Met Leu Lys 
100 105 110 

5 

Asn His Cys Leu His His Arg His Pro Ala Ser Glu Val Asp Pro Asp 
115 120 125 

10 

Phe His Asp Gly Lys Arg Thr Asn Ala He Phe Trp Tyr Leu His Phe 
130 135 140 



15 Met He Glu Tyr Ser Ser Trp Gin Gin Leu He Val Leu Thr He Leu 
145 150 155 160 



Phe Asn Leu Ala Lys Tyr Val Leu His He His Gin He Asn Leu He 
20 165 170 175 



Leu Phe Trp Ser He Pro Pro He Leu Ser Ser He Gin Leu Phe Tyr 
180 185 190 

25 

Phe Gly Thr Phe Leu Pro His Arg Glu Pro Lys Lys Gly .Tyr val Tyr 
195 200 205 

30 

Pro His Cys Ser Gin Thr He Lys Leu Pro Thr Phe Leu Ser Phe He 
210 215 220 



35 Ala Cys Tyr His Phe Gly Tyr His Glu Glu His His Glu Tyr Pro His 
225 230 235 240 



Val Pro Trp Trp Gin Leu Pro Ser Val Tyr Lys Gin Arg Val Phe Asn 
40 245 250 255 



Asn Ser Val Thr Asn Ser 
260 

45 

<210> 47 



<211> 762 

50 



t-*|- 0,5000 



5 



10 



78 

<212> DNA 

<213> Nostoc punctiforme ATCC 29133 



<220> 

<221> CDS 

<222> (1) . . (762) 

<223> 



15 

<400> 47 

gtg ate cag tta gaa caa cca etc agt cat caa gca aaa ctg act cca 
Val He Gin Leu Glu Gin Pro Leu Ser His Gin Ala Lys Leu Thr Pro 
20 1 5 10 15 

gta ctg aga agt aaa tct cag ttt aag ggg ctt ttc att get att gtc 
Val Leu Arg Ser Lys Ser Gin Phe Lys Gly Leu Phe He Ala He Val 
20 25 30 

25 

att gtt age gca tgg gtc att age ctg agt tta tta ctt tec ctt gac 
He Val Ser Ala Trp Val He Ser Leu Ser Leu Leu Leu. Ser Leu Asp 
35 40 45 

30 ate tea aag eta aaa ttt tgg atg tta ttg cct gtt ata eta tgg caa 
He Ser Lys Leu Lys Phe Trp Met Leu Leu Pro Val He Leu Trp Gin 
50 55 60 

aca ttt tta tat acg gga tta ttt att aca tct cat gat gee atg cat 
35 Thr Phe Leu Tyr Thr Gly Leu Phe He Thr Ser His Asp Ala Met His 
65 70 75 80 

ggc gta gta ttt ccc caa aac acc aag att aat cat ttg att gga aca 
Gly Val Val Phe Pro Gin Asn Thr Lys He Asn His Leu He Gly Thr 
40 85 90 95 

ttg acc eta tec ctt tat ggt ctt tta cca tat caa aaa eta ttg aaa 
Leu Thr Leu Ser Leu Tyr Gly Leu Leu Pro Tyr Gin Lys Leu Leu Lys 
100 105 110 

45 

aaa cat tgg tta cac cac cac aat cca gca age tea ata gac ccg gat 
Lys His Trp Leu His His His Asn Pro Ala Ser Ser He Asp Pro Asp 
115 120 125 

50 ttt cac aat ggt aaa cac caa agt ttc ttt get tgg tat ttt cat ttt 



s 



48 



96 



144 



192 



240 



288 



336 



384 



432 



79 

Phe His Asn Gly Lys His Gin Ser Phe Phe Ala Trp Tyr Phe His Phe 
130 135 140 



atg aaa ggt tac tgg agt tgg ggg caa ata att gcg ttg act att att 
Met Lys Gly Tyr Trp Ser Trp Gly Gin lie lie Ala Leu Thr He He 
145 150 155 ISO 

tat aac ttt get aaa tac ata etc cat ate cca agt gat aat eta act 
Tyr Asn Phe Ala Lys Tyr He Leu His He Pro. Ser Asp Asn Leu Thr 
165 170 175 

tac ttt tgg gtg eta ccc teg ctt tta agt tea tta caa tta ttc tat 
Tyr Phe Trp Val Leu Pro Ser Leu Leu Ser Ser Leu Gin Leu Phe Tyr 
180 185 190 

ttt ggt act ttt tta ccc cat agt gaa cca ata ggg ggt tat gtt cag 
Phe Gly Thr Phe Leu Pro His Ser Glu Pro He Gly Gly Tyr Val Gin 
195 200 205 

cct cat tgt gec caa aca att age cgt cct att tgg tgg tea ttt ate 
Pro His Cys Ala Gin Thr He Ser Arg Pro He Trp Trp Ser Phe He 
210 215 220 

acg tgc tat cat ttt ggc tac cac gag gaa cat cac gaa tat cct cat 
Thr Cys Tyr His Phe Gly Tyr His Glu Glu His His Glu Tyr Pro His 
225 230 235 240 

. « 

att tct tgg tgg cag tta cca gaa att tac aaa gca aaa tag 
He Ser Trp Trp Gin Leu Pro Glu He Tyr Lys Ala Lys 
245 250 



<210> 48 

<211> 253 

<212> PRT 

<213> Nostoc punctiforme ATCC 29133 



<400> 48 

Val He Gin Leu Glu Gin Pro Leu Ser His Gin Ala Lys Leu Thr Pro 
15 10 15 



Val Leu Arg Ser Lys Ser Gin Phe Lys Gly Leu Phe He Ala He Val 
20 25 30 
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He Val Ser Ala Trp Val He Ser Leu Ser Leu Leu Leu Ser Leu Asp 
35 40 45 

5 

He Ser Lys Leu Lys Phe Trp Met Leu Leu Pro Val He Leu Trp Gin 
50 55 60 

10 

Thr Phe Leu Tyr Thr Gly Leu Phe He Thr Ser His Asp Ala Met His 
G5 70 75 80 

15 Gly val Val Phe Pro Gin Asn Thr Lys He Asn His Leu He Gly Thr 

85 90 95 



Leu Thr Leu Ser Leu Tyr Gly Leu Leu Pro Tyr Gin Lys Leu Leu Lys 
20 100 105 HO 

Lys His Trp Leu His His His Asn Pro Ala Ser Ser He Asp Pro Asp 
115 120 I 25 

25 

Phe His Asn Gly Lys His Gin Ser Phe Phe Ala Trp Tyr «Phe His Phe 
130 135 140 

30 

Met Lys Gly Tyr Trp Ser Trp Gly Gin He He Ala Leu Thr He He 



145 



150 155 160 



35 Tyr Asn Phe Ala Lys Tyr He Leu His He Pro Ser Asp Asn Leu Thr 

165 170 175 



Tyr Phe Trp Val Leu Pro Ser Leu Leu Ser Ser Leu Gin Leu Phe Tyr 
40 ' 180 185 190 



Phe Gly Thr Phe Leu Pro His Ser Glu Pro He Gly Gly Tyr val Gin 

45 



195 200 205 



Pro His Cys Ala Gin Thr He Ser Arg Pro He Trp Trp Ser Phe He 
210 215 220 



50 



rr ooooo 



81 

Thr Cys Tyr His Phe Gly Tyr His Glu Glu His His Glu Tyr Pro His 
225 230 235 240 



5 lie Ser Trp Trp Gin Leu Pro Glu lie Tyr Lys Ala Lys 

245 250 



10 



<210> 49 

<211> 1536 

<212> DNA 

15 <213> Deinococcus radiodurans Rl 

<220> 

20 

<221> CDS 
<222> (1)..(1536) 
25 <223> 



<400> 49 

30 atg ccg gat tac gac ctg ate gtc atg ggc gcg ggc cac aac gcg ctg 48 

Met Pro Asp Tyr Asp Leu lie Val Met Gly Ala Gly His Asn Ala Leu 
15 10 15 

gtg act get gee tac gee gec egg gcg ggc ctg aaa gtc ggc gtg ttc 96 
35 Val Thr Ala Ala Tyr Ala Ala Arg Ala Gly Leu Lys val Gly Val Phe 
20 25 30 

gag egg egg cac etc gtc ggc ggg gcg gtc age acc gag gag gtc gtg 144 
Glu Arg Arg His Leu Val Gly Gly Ala Val Ser Thr Glu Glu Val Val 
40 35 40 45 

ccc ggt tac cgc ttc gac tac ggc ggc age gee cac ate ctg att egg 192 
Pro Gly Tyr Arg Phe Asp Tyr Gly Gly Ser Ala His He Leu He Arg 
50 55 60 



45 



atg acg ccc ate gtg cgc gaa etc gaa etc acg egg cac ggg ctg cat 
Met Thr Pro He Val Arg Glu Leu Glu Leu Thr Arg His Gly Leu His 
65 70 75 80 



240 



50 tac etc gaa gtg gac cct atg ttt cac get tec gac ggt gaa acg 



ccc 288 



rr ooooo 



82 

Tyr Leu Glu Val Asp Pro Met Phe His Ala Ser Asp Gly Glu Thr Pro 
85 90 95 

tgg ttc att- cac cgc gac gcc ggg egg acc ate cgc gaa ctg gac gaa 33 6 

5 Trp Phe lie His Arg Asp Ala Gly Arg Thr lie Arg Glu Leu Asp Glu 
100 105 110 

aag ttt ccc ggg cag ggc gac gcc tac ggg cgc ttt etc gac gat tgg 3 84 

Lys Phe Pro Gly Gin Gly Asp Ala Tyr Gly Arg Phe Leu Asp Asp Trp 
10 115 120 125 

aca ccc ttc gcg cgc gcc gtg gcc gac ctg ttc aac teg gcg ccg ggg 432 
Thr Pro Phe Ala Arg Ala Val Ala Asp Leu Phe Asn Ser Ala Pro Gly 
130 135 140 



15 



35 



480 



ccg etc gac ctg ggc aaa atg gtg atg cgc age ggc cag ggc aag gac 
Pro Leu Asp Leu Gly Lys Met Val Met Arg Ser Gly Gin Gly Lys Asp 
145 150 155 160 

20 tgg aac gag cag etc ccg cgc ate ctg egg ccc tac ggc gac gtg gcg 52 8 

Trp Asn Glu Gin Leu Pro Arg He Leu Arg Pro Tyr Gly Asp Val Ala 
165 170 175 

cgc gag tac ttc age gag gag cgc gtg egg get ccc ctg acc tgg atg 57 6 

25 Arg Glu Tyr Phe Ser Glu Glu Arg Val Arg Ala Pro Leu Thr Trp Met s 
180 185 190 

gcg gcc cag age ggc ccc cca ccc teg gac ccg ctg age gcg ccc ttt 624 
Ala Ala Gin Ser Gly Pro Pro Pro Ser Asp Pro Leu Ser Ala Pro Phe 
30 195 200 205 

ttg ctg tgg cac ccg etc tac cac gaa ggc ggc gtg gcg egg ccc aaa 672 
Leu Leu Trp His Pro Leu Tyr His Glu Gly Gly Val Ala Arg Pro Lys 
210 215 220 



720 



ggc ggc age ggc ggc ctg acc aaa gcc ctg cgc egg gcc acc gag gcc 
Gly Gly Ser Gly Gly Leu Thr Lys Ala Leu Arg Arg Ala Thr Glu Ala 
225 230 235 240 

40 gaa ggc ggc gag gtc ttc acc gac gcg ccg gtc aag gaa att ctg gtc 768 
Glu Gly Gly Glu Val Phe Thr Asp Ala Pro Val Lys Glu He Leu Val 
245 250 255 

aag gac ggc aag gcg cag ggc ate egg ctg gaa age ggc gag acg tac 816 
45 Lys Asp Gly Lys Ala Gin Gly He Arg Leu Glu Ser Gly Glu Thr Tyr 
260 265 270 

acc gcc cgc gcc gtc gtg teg ggc gtc cac ate ctg acc act gcg aat 864 
Thr Ala Arg Ala Val Val Ser Gly Val His lie Leu Thr Thr Ala Asn 
50 275 280 285 
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gcc ctg ccc gcc gaa tat gtc cct age gec gec agg aat gtg cgc gtg 912 
Ala Leu Pro Ala Glu Tyr Val Pro Ser Ala Ala Arg Asn Val Arg Val 
290 295 300 

5 

ggc aac ggc ttc ggc atg att ttg cgc etc gcc etc agt gaa aaa gtc 960 
Gly Asn Gly Phe Gly Met lie Leu Arg Leu Ala Leu Ser Glu Lys Val 
305 310 315 320 

10 aaa tac cgt cac cac acc gag ccc gac tea cgc ate ggc ctg gga ttg 1008 
Lys Tyr Arg His His Thr Glu Pro Asp Ser Arg lie Gly Leu Gly Leu 
325 330 335 

ctg ate aaa aac gag egg caa ate atg cag ggc tac ggc gaa tac etc 1056 
15 Leu lie Lys Asn Glu Arg Gin lie Met Gin Gly Tyr Gly Glu Tyr Leu 
340 345 350 

gcc ggg cag ccc acc acc gac ccg ccc etc gtc gcc atg age ttc age 1104 
Ala Gly Gin Pro Thr Thr Asp Pro Pro Leu Val Ala Met Ser Phe Ser 
20 355 360 365 

gcg gtg gac gac teg etc gcc cca ccg aac ggc gac gtg ttg tgg ctg 1152 
Ala Val Asp Asp Ser Leu Ala Pro Pro Asn Gly Asp Val Leu Trp Leu 
370 375 380 

25 ' 

tgg gcg cag tac tac ccc ttc gag etc gcc acc ggg age tgg gaa acg 1200 

Trp Ala Gin Tyr Tyr Pro Phe Glu Leu Ala Thr Gly Ser 'Trp Glu Thr 
385 390 395 400 

30 cgc acc gcc gaa gcg egg gag aac ate ctg egg gcc ttt gag cac tac 1248 
Arg Thr Ala Glu Ala Arg Glu Asn He Leu Arg Ala Phe Glu His Tyr 
405 410 415 

gcg ccg ggc acc cgc gac acg att gtg ggc gaa etc gtg cag acg ccg 1296 
35 Ala Pro Gly Thr Arg Asp Thr He Val Gly Glu Leu Val Gin Thr Pro 
420 425 430 

cag tgg ctg gaa acc aac etc ggc ctg cac egg ggc aac gtg atg cac 1344 
Gin Trp Leu Glu Thr Asn Leu Gly Leu His Arg Gly Asn Val Met His 
40 435 440 445 

ctg gaa atg tec ttc gac cag atg ttc tec ttc cgc ccc tgg ctg aaa 13 92 

Leu Glu Met Ser Phe Asp Gin Met Phe Ser Phe Arg Pro Trp Leu Lys 
450 455 460 



45 



gcg age cag tac cgc tgg ccg ggc gtg cag ggg ctg tac etc acc ggc 144 0 

Ala Ser Gin Tyr Arg Trp Pro Gly Val Gin Gly Leu Tyr Leu Thr Gly 
465 470 475 480 



50 gcc age acc cac ccc ggc gga ggc ate atg ggc gcc teg gga cgc aac 



1488 



rr ooooo 



84 

Ala Ser Thr His Pro Gly Gly Gly He Met Gly Ala Ser Gly Arg Asn 
485 490 495 

gcg gcg egg gtc ate gtg aag gac ctg acg egg agg cgc tgg aaa tga 153 6 

5 Ala Ala Arg Val He Val Lys Asp Leu Thr Arg Arg Arg Trp Lys 
500 505 510 



<210> 50 

10 

<211> 511 

<212> PRT 

15 <213> Deinococcus radiodurans Rl 



<400> 50 

20 

Met Pro Asp Tyr Asp Leu He Val Met Gly Ala Gly His Asn Ala Leu 
15 10 15 



25 Val Thr Ala Ala Tyr Ala Ala Arg Ala Gly Leu Lys Val Gly Val Phe ' 
20 25 30 



Glu Arg Arg His Leu Val Gly Gly Ala Val Ser Thr Glu Glu Val Val 
30 35 40 45 



Pro Gly Tyr Arg Phe Asp Tyr Gly Gly Ser Ala His He Leu He Arg 
50 55 60 

35 

Met Thr Pro He Val Arg Glu Leu Glu Leu Thr Arg His Gly Leu His 
65 70 75 80 

40 

Tyr Leu Glu Val Asp Pro Met Phe His Ala Ser Asp Gly Glu Thr Pro 
85 90 95 



45 Trp Phe He His Arg Asp Ala Gly Arg Thr He Arg Glu Leu Asp Glu 
100 105 HO 



Lys Phe Pro Gly Gin Gly Asp Ala Tyr Gly Arg Phe Leu Asp Asp Trp 
50 115 120 125 



85 



Thr Pro Phe Ala Arg Ala Val Ala Asp Leu Phe Asn Ser Ala Pro Gly 
130 135 140 

5 

Pro Leu Asp Leu Gly Lys Met Val Met Arg Ser Gly Gin Gly Lys Asp 
145 150 155 160 

10 

Trp Asn Glu Gin Leu Pro Arg He Leu Arg Pro Tyr Gly Asp Val Ala 
165 170 l" 75 



15 Arg Glu Tyr Phe Ser Glu Glu Arg Val Arg Ala Pro Leu Thr Trp Met 
180 185 190 

Ala Ala Gin Ser Gly Pro Pro Pro Ser Asp Pro Leu Ser Ala Pro Phe 
20 195 200 205 

Leu Leu Trp His Pro Leu Tyr His Glu Gly Gly Val Ala Arg Pro Lys 
210 215 220 

25 

Gly Gly Ser Gly Gly Leu Thr Lys Ala Leu Arg Arg Ala .Thr Glu Ala 
225 * 230 235 240 

30 

Glu Gly Gly Glu Val Phe Thr Asp Ala Pro val Lys Glu He Leu Val 
245 250 255 



35 Lys Asp Gly Lys Ala Gin Gly He Arg Leu Glu Ser Gly Glu Thr Tyr 
260 265 270 



Thr Ala Arg Ala Val Val Ser Gly Val His He Leu Thr Thr Ala Asn 
40 275 280 285 



Ala Leu Pro Ala Glu Tyr Val Pro Ser Ala Ala Arg Asn Val Arg Val 
290 295 300 

45 

Gly Asn Gly Phe Gly Met He Leu Arg Leu Ala Leu Ser Glu Lys Val 
305 ' 310 315 320 



50 



86 

Lys Tyr Arg His His Thr Glu Pro Asp Ser Arg He Gly Leu Gly Leu 



325 330 



335 



5 Leu He Lys Asn Glu Arg Gin He Met Gin Gly Tyr Gly Glu Tyr Leu 
340 345 350 



Ala Gly Gin Pro Thr Thr Asp Pro Pro Leu Val Ala Met Ser Phe Ser 
10 355 360 365 



Ala Val Asp Asp Ser Leu Ala Pro Pro Asn Gly Asp Val Leu Trp Leu 
370 375 380 

15 

Trp Ala Gin Tyr Tyr Pro Phe Glu Leu Ala Thr Gly Ser Trp Glu Thr 
385 390 395 400 

20 

Arg Thr Ala Glu Ala Arg Glu Asn He Leu Arg Ala Phe Glu His Tyr 
405 410 415 



25 Ala Pro Gly Thr Arg Asp Thr He Val Gly Glu Leu Val Gin Thr Pro 
420 425 430 



Gin Trp Leu Glu Thr Asn Leu Gly Leu His Arg Gly Asn Val Met His 
30 435 440 445 



Leu Glu Met Ser Phe Asp Gin Met Phe Ser Phe Arg Pro Trp Leu Lys 
450 455 460 

35 

Ala Ser Gin Tyr Arg Trp Pro Gly Val Gin Gly Leu Tyr Leu Thr Gly 
465 470 475 480 

40 

Ala Ser Thr His Pro Gly Gly Gly He Met Gly Ala Ser Gly Arg Asn 
485 490 495 



45 Ala Ala Arg Val He Val Lys Asp Leu Thr Arg Arg Arg Trp Lys 
500 505 510 



<210> 51 

50 



rr uoouo 

87 

<211> 1608 
<212> DNA 

<213> Haematococcus pluvialis 



<220> 

<221> CDS 

<222> (3).. (971) 

<223> 



<400> 51 

ct aca ttt cac aag ccc gtg age ggt gca age get ctg ccc cac ate 
Thr Phe His Lys Pro Val Ser Gly Ala Ser Ala Leu Pro His He 
15 10 15 



ggc cca cct cct cat etc cat egg tea ttt get get ace acg atg ctg 
Gly Pro Pro Pro His Leu His Arg Ser Pile Ala Ala Thr Thr Met Leu 
20 25 30 

. » 

teg aag ctg cag tea ate age gtc aag gee cgc cgc gtt gaa eta gee 
Ser Lys Leu Gin Ser He Ser Val Lys Ala Arg Arg Val Glu Leu Ala 
35 40 45 



cgc gac ate acg egg ccc aaa gtc tgc ctg cat get cag egg tgc teg 
Arg Asp lie Thr Arg Pro Lys Val Cys Leu His Ala Gin Arg Cys Ser 
50 55 60 



tta gtt egg ctg cga gtg gca gca cca cag aca gag gag gcg ctg gga 
Leu Val Arg Leu Arg Val Ala Ala Pro Gin Thr Glu Glu Ala Leu Gly 
65 70 75 



ace gtg cag get gee ggc gcg ggc gat gag cac age gee gat gta gca 
Thr Val Gin Ala Ala Gly Ala Gly Asp Glu His Ser Ala Asp Val Ala 
80 85 90 95 



etc cag cag ctt gac egg get ate gca gag cgt cgt gee egg cgc aaa 
Leu Gin Gin Leu Asp Arg Ala He Ala Glu Arg Arg Ala Arg Arg Lys 
100 105 HO 



egg gag cag ctg tea "tac cag get gee gee att gca gca tea att ggc 
Arg Glu Gin Leu Ser Tyr Gin Ala' Ala Ala He Ala Ala Ser He Gly 
115 120 125 



rr ooooj 



88 

gtg tea ggc att gec ate ttc gec acc tac ctg aga ttt gec atg cac 
Val Ser Gly He Ala He Phe Ala Thr Tyr Leu Arg Phe Ala Met His 
130 135 140 

atg acc gtg ggc ggc gca gtg cca tgg ggt gaa gtg get ggc act etc 
Met Thr Val Gly Gly Ala Val Pro Trp Gly Glu Val Ala Gly Thr Leu 
145 150 155 

etc ttg gtg gtt ggt ggc gcg etc ggc atg gag atg tat gee cgc tat 
Leu Leu Val Val Gly Gly Ala Leu Gly Met Glu Met Tyr Ala Arg Tyr 
160 165 170 175 

gca cac aaa gee ate tgg cat gag teg cct ctg ggc tgg ctg ctg cac 
Ala His Lys Ala He Trp His Glu Ser Pro Leu Gly Trp Leu Leu His 
180 185 190 

aag age cac cac aca cct cgc act gga ccc ttt gaa gec aac gac ttg 
Lys Ser His His Thr Pro Arg Thr Gly Pro Phe Glu Ala Asn Asp Leu 
195 200 205 

ttt gca ate ate aat gga ctg ccc gee atg etc ctg tgt acc ttt ggc 
Phe Ala He He Asn Gly Leu Pro Ala Met Leu Leu Cys Thr Phe Gly 
210 215 220 

ttc tgg ctg ccc aac gtc ctg ggg gcg gee tgc ttt gga gcg ggg ctg 
Phe Trp Leu Pro Asn Val Leu Gly Ala Ala Cys Phe Gly .Ala Gly Leu 
225 230 235 

ggc ate acg eta tac ggc atg gca tat atg ttt gta cac gat ggc ctg 
Gly He Thr Leu Tyr Gly Met Ala Tyr Met Phe Val His Asp Gly Leu 
240 245 250 255 

gtg cac agg cgc ttt ccc acc ggg ccc ate get ggc ctg ccc tac atg 
Val His Arg Arg Phe Pro Thr Gly Pro He Ala Gly Leu Pro Tyr Met 
260 265 270 

aag cgc ctg aca gtg gec cac cag eta cac cac age ggc aag tac ggt 
Lys Arg Leu Thr Val Ala His Gin Leu His His Ser Gly Lys Tyr Gly 
275 280 285 

ggc gcg ccc tgg ggt atg ttc ttg ggt cca cag gag ctg cag cac att 
Gly Ala Pro Trp Gly Met Phe Leu Gly Pro Gin Glu Leu Gin His He 
290 295 300 

cca ggt gcg gcg gag gag gtg gag cga ctg gtc ctg gaa ctg gac tgg 
Pro Gly Ala. Ala Glu Glu Val Glu Arg Leu Val Leu Glu Leu Asp Trp 
305 310 315 



tec aag egg tag ggtgcggaac caggcacgct ggtttcacac ctcatgcctg 



PF 53863 

89 

Ser Lys Arg 
320 

tgataaggtg tggctagagc gatgcgtgtg agacgggtat gtcacggtcg actggtctga 1071 

5 

tggccaatgg catcggccat gtctggtcat cacgggctgg ttgcctgggt gaaggtgatg 1131 
cacatcatca tgtgcggttg gaggggctgg cacagtgtgg gctgaactgg agcagttgtc 1191 
10 caggctggcg ttgaatcagt gagggtttgt gattggcggt tgtgaagcaa tgactccgcc 1251 
catattctat ttgtgggagc tgagatgatg gcatgcttgg gatgtgcatg gatcatggta 1311 
gtgcagcaaa ctatattcac ctagggctgt tggtaggatc aggtgaggcc ttgcacattg 1371 

15 

catgatgtac tcgtcatggt gtgttggtga gaggatggat gtggatggat gtgtattctc 1431 
agacgtagac cttgactgga ggcttgatcg agagagtggg ccgtattctt tgagagggga 1491 
20 ggctcgtgcc agaaatggtg agtggatgac tgtgacgctg tacattgcag gcaggtgaga 1551 
tgcactgtct cgattgtaaa atacattcag atgcaaaaaa aaaaaaaaaa aaaaaaa 

25 <210> S2 
<211> 322 
<212> PRT 

30 

<213> Haematococcus pluvialis 
35 <400> 52 

Thr Phe His Lys Pro Val Ser Gly Ala Ser Ala Leu Pro His He Gly 
15 10 15 



1608 



40 



Pro Pro Pro His Leu His Arg Ser Phe Ala Ala Thr Thr Met Leu Ser 
20 25 3° 



45 Lys Leu Gin Ser He Ser Val Lys Ala Arg Arg Val Glu Leu Ala Arg 
35 40 45 



Asp He Thr Arg Pro Lys Val Cys Leu His Ala Gin Arg Cys Ser Leu 
50 50 . . 55 SO 



t>3ttt>3 



90 



Val Arg Leu Arg Val Ala Ala Pro Gin Thr Glu Glu Ala Leu Gly Thr 
65 ~ 70 75 80 

5 

Val Gin Ala Ala Gly Ala Gly Asp Glu His Ser Ala Asp Val Ala Leu 
85 90 95 

10 

Gin Gin Leu Asp Arg Ala lie Ala Glu Arg Arg Ala Arg Arg Lys Arg 
100 105 HO 



15 Glu Gin Leu Ser Tyr Gin Ala Ala Ala He Ala Ala Ser He Gly Val 
115 120 125 



Ser Gly He Ala He Phe Ala Thr Tyr Leu Arg Phe Ala Met His Met 
20 130 135 140 



Thr Val Gly Gly Ala Val Pro Trp Gly Glu Val Ala Gly Thr Leu Leu 
145 150 155 160 

25 

Leu Val Val Gly Gly Ala Leu Gly Met Glu Met Tyr Ala .Arg Tyr Ala 
165 170 175 

30 

His Lys Ala He Trp His Glu Ser Pro Leu Gly Trp Leu Leu His Lys 
180 185 190 



35 Ser His His Thr Pro Arg Thr Gly Pro Phe Glu Ala Asn Asp Leu Phe 
195 200 205 



Ala He He Asn Gly Leu Pro Ala Met Leu Leu Cys Thr Phe Gly Phe 
40 210 215 220 



Trp Leu Pro Asn Val Leu Gly Ala Ala Cys Phe Gly Ala Gly Leu Gly 
225 230 235 " 240 

45 

He Thr Leu Tyr Gly Met Ala Tyr Met Phe Val His Asp Gly Leu Val 
245 250 255 



50 



PF 53863 



91 

His Arg Arg Phe Pro Thr Gly Pro lie Ala Gly Leu Pro Tyr Met Lys 
260 265 270 



5 Arg Leu Thr Val Ala His Gin Leu His His Ser Gly Lys Tyr Gly Gly 
275 280 285 



Ala Pro Trp Gly Met Phe Leu Gly Pro Gin Glu Leu Gin His lie Pro 
10 290 295 300 



Gly Ala Ala Glu Glu Val Glu Arg Leu Val Leu Glu Leu Asp Trp Ser 
305 310 315 320 

15 

Lys Arg 



20 

<210> 53 
<211> 1503 
25 <212> DNA 

<213> Tomate 

30 

<220> 

<221> CDS 
35 <222> (1)..(1503) 
<223> 



40 



45 



<400> 53 

atg gat act ttg ttg aaa acc cca aat aac ctt gaa ttt ctg aac cca 

Met Asp Thr Leu Leu Lys Thr Pro Asn Asn Leu Glu Phe Leu Asn Pro 

1 5 10 15 

cat cat ggt ttt get gtt aaa get agt acc ttt aga tct gag aag cat 

His His Gly Phe Ala Val Lys Ala Ser Thr Phe Arg Ser Glu Lys His 

20 25 30 



48 



96 



50 cat aat ttt ggt tct agg aag ttt tgt gaa' act ttg ggt aga agt gtt 



144 



92 

His Asn Phe Gly Ser Arg Lys Phe Cys Glu Thr Leu Gly Arg Ser Val 
35 40 45 

tgt gtt aag ggt agt agt agt get ctt tta gag ctt gta cct gag acc 
Cys Val Lys Gly Ser Ser Ser Ala Leu Leu Glu Leu Val Pro Glu Thr 
50 55 60 

aaa aag gag aat ctt gat ttt gag ctt cct atg tat gac cct tea aaa 
Lys Lys Glu Asn Leu Asp Phe Glu Leu Pro Met Tyr Asp Pro Ser Lys 
65 70 75 80 



ggg g fct 9 tt; 9T at ctt S ct 9rtg gtt ggt ggt ggc cct gca gga ctt 

Gly Val Val Val Asp Leu Ala Val Val Gly Gly Gly Pro Ala Gly Leu 
85 90 95 



get gtt gca cag caa gtt tct gaa gca gga etc tct gtt tgt tea att 
Ala Val Ala Gin Gin Val Ser Glu Ala Gly Leu Ser Val Cys Ser lie 
100 105 HO 



gat ccg aat cct aaa ttg ata tgg cct aat aac tat ggt gtt tgg gtg 
Asp Pro Asn Pro Lys Leu He Trp Pro Asn Asn Tyr Gly Val Trp Val 
115 120 125 



gat gaa ttt gag get atg gac ttg tta gat tgt eta gat get acc tgg 
Asp Glu Phe Glu Ala Met Asp Leu Leu Asp Cys Leu Asp Ala Thr Trp 
130 135 140 

tct ggt gca gca gtg tac att gat gat aat acg get aaa gat ctt cat 
Ser Gly Ala Ala Val Tyr He Asp Asp Asn Thr Ala Lys Asp Leu His 
145 150 155 160 



aga cct tat gga agg gtt aac egg aaa cag ctg aaa teg aaa atg atg 
Arg Pro Tyr Gly Arg Val Asn Arg Lys Gin Leu Lys Ser Lys Met Met 
165 170 175 



cag aaa tgt ata atg aat ggt gtt aaa ttc cac caa gee aaa gtt ata 
Gin Lys Cys He Met Asn Gly Val Lys Phe His Gin Ala Lys Val He 
180 185 190 



a-ag gtg att cat gag gaa teg aaa tec atg ttg ata tgc aat gat ggt 
Lys Val He His Glu Glu Ser Lys Ser Met Leu He Cys Asn Asp Gly 
195 200 205 



att act att cag gca acg gtg gtg etc gat gca act ggc ttc tct aga 
He Thr He Gin Ala Thr Val Val Leu Asp Ala Thr Gly Phe Ser Arg 
210 215 220 

tct ctt gtt cag tat gat aag cct tat aac ccc ggg tat caa gtt get 
Ser Leu Val Gin Tyr Asp Lys Pro Tyr .Asn Pro Gly Tyr Gin Val Ala 
225 230 235 240 



rr ooooo 



93 

tat ggc att ttg get gaa gtg gaa gag cac ccc ttt gat gta aac aag 768 
Tyr Gly He Leu Ala Glu Val Glu Glu His Pro Phe Asp Val Asn Lys 
245 250 255 

5 

atg gtt ttc atg gat tgg cga gat tct cat ttg aag aac aat act gat 816 
Met Val Phe Met Asp Trp Arg Asp Ser His Leu Lys Asn Asn Thr Asp 
260 265 270 

10 etc aag gag aga aat agt aga ata cca act ttt ctt tat gca atg cca . 864 
Leu Lys Glu Arg Asn Ser Arg He Pro Thr Phe Leu Tyr Ala Met Pro 
275 280 285 

ttt tea tec aac agg ata ttt ctt gaa gaa aca tea etc gta get cgt 912 
15 Phe Ser Ser Asn Arg He Phe Leu Glu Glu Thr Ser Leu Val Ala Arg 
290 295 300 



45 



960 



1008 



cct ggc ttg cgt ata gat gat att caa gaa cga atg gtg get cgt tta 
Pro Gly Leu Arg lie Asp Asp He Gin Glu Arg Met Val Ala Arg Leu 
20 305 310 315 320 

aac cat ttg ggg ata aaa gtg aag age att gaa gaa gat gaa cat tgt 
Asn His Leu Gly He Lys Val Lys Ser He Glu Glu Asp Glu His Cys 
325 330 335 

25 

eta ata cca atg ggt ggt cca ctt cca gta tta cct cag aga gtc gtt 1056 
Leu He Pro Met Gly Gly Pro Leu Pro Val Leu Pro Gin , Arg Val Val 
340 345 350 

30 gga ate ggt ggt aca get ggc atg gtt cat cca tec ace ggt tat atg 1104 
Gly He Gly Gly Thr Ala Gly Met Val His Pro Ser Thr Gly Tyr Met 
355 360 365 

gtg gca agg aca eta get gcg get cct gtt gtt gec aat gee ata att 1152 
35 Val Ala Arg Thr Leu Ala Ala Ala Pro Val Val Ala Asn Ala He He 
370 375 380 

caa tac etc ggt tct gaa aga agt cat teg ggt aat gaa tta tec aca 120 0 

Gin Tyr Leu Gly Ser Glu Arg Ser His Ser Gly Asn Glu Leu Ser Thr 
40 385 390 395 400 

get gtt tgg aaa gat ttg tgg cct ata gag agg aga cgt caa aga gag 124 8 

Ala Val Trp Lys Asp Leu Trp Pro He Glu Arg Arg Arg Gin Arg Glu 
405 410 415 



ttc ttc tgc ttc ggt atg gat att ctt ctg aag ctt gat tta cct get 129 6 

Phe Phe Cys Phe Gly Met Asp He Leu Leu Lys Leu Asp Leu Pro Ala 
420 425 430 



50 



aca aga agg ttc ttt gat gca ttc ttt gac tta gaa cct cgt tat tgg 



1344 



PF 53863 



1503 



94 

Thr Arg Arg Phe Phe Asp Ala Phe Phe Asp Leu Glu Pro Arg Tyr Trp 
435 440 445 

cat ggc ttc tta teg tct cga ttg ttt eta cct gaa etc ata gtt ttt 1392 
5 His Gly Phe Leu Ser Ser Arg Leu Phe Leu Pro Glu Leu lie Val Phe 
450 455 460 

ggg ctg tct eta ttc tct cat get tea aat act tct aga ttt gag ata 1440 
Gly Leu Ser Leu Phe Ser His Ala Ser Asn Thr Ser Arg Phe Glu lie 
10 465 470 475 480 

atg aca aag gga act gtt cca tta gta aat atg ate aac aat ttg tta 1488 
Met Thr Lys Gly Thr Val Pro Leu Val Asn Met lie Asn Asn Leu Leu 
485 490 495 

15 

cag gat aaa gaa tga 
Gin Asp Lys Glu 
500 

20 

<210> 54 
<211> 500 
25 <212> PRT 

<213> Tomate 



30 

<400> 54 

Met Asp Thr Leu Leu Lys Thr Pro Asn Asn Leu Glu Phe Leu Asn Pro 
15 10 15 

35 

His His Gly Phe Ala Val Lys Ala Ser Thr Phe Arg Ser Glu Lys His 
20 25 30 

40 

His Asn Phe Gly Ser Arg Lys Phe Cys Glu Thr Leu Gly Arg Ser Val 
35 40 45 



45 Cys Val Lys Gly Ser Ser Ser Ala Leu Leu Glu Leu Val Pro Glu Thr 
50 55 60 



Lys Lys Glu Asn Leu Asp Phe Glu Leu Pro Met Tyr Asp Pro Ser Lys 
50 65 70 75 80 



PF 53863 



95 



Gly Val Val Val Asp Leu Ala Val Val Gly Gly Gly Pro Ala Gly Leu 
85 90 95 



Ala Val Ala Gin Gin Val Ser Glu Ala Gly Leu Ser Val Cys Ser He 
100 105 110 

10 

Asp Pro Asn Pro Lys Leu lie Trp Pro Asn Asn Tyr Gly Val Trp Val 
115 120 125 



15 Asp Glu Phe Glu Ala Met Asp Leu Leu Asp Cys Leu Asp Ala Thr Trp 
130 135 140 

Ser Gly Ala Ala Val Tyr He Asp Asp Asn Thr Ala Lys Asp Leu His 
20 145 * 150 155 ISO 

Arg Pro Tyr Gly Arg Val Asn Arg Lys Gin Leu Lys Ser Lys Met Met 
165 170 l" 75 

25 

Gin Lys Cys He Met Asn Gly Val Lys Phe His Gin Ala, Lys Val He 
180 185 I 90 

30 

Lys Val He His Glu Glu Ser Lys Ser Met Leu He Cys Asn Asp Gly 
195 200 205 

35 He Thr He Gin Ala Thr Val Val Leu Asp Ala Thr Gly Phe Ser Arg 
210 215 220 



Ser Leu Val Gin Tyr Asp Lys Pro Tyr Asn Pro Gly Tyr Gin Val Ala 
40 225 230 235 240 



Tyr Gly He Leu Ala Glu Val Glu Glu His Pro Phe Asp Val Asn Lys 
245 250 255 

45 

Met Val Phe Met Asp Trp Arg Asp Ser His Leu Lys Asn Asn Thr Asp 
260 265 270 



50 



96 

Leu Lys Glu Arg Asn Ser Arg lie Pro Thr Phe Leu Tyr Ala Met Pro 
275 280 285 



Phe Ser Ser Asn Arg lie Phe Leu Glu Glu Thr Ser Leu Val Ala Arg 
290 295 300 



Pro Gly Leu Arg lie Asp Asp lie Gin Glu Arg Met Val Ala Arg Leu 
305 310 315 320 



Asn His Leu Gly lie Lys Val Lys Ser lie Glu Glu Asp Glu His Cys 
325 330 335 



Leu lie Pro Met Gly Gly Pro Leu Pro Val Leu Pro Gin Arg Val Val 
340 345 350 



Gly lie Gly Gly Thr Ala Gly Met Val His Pro Ser Thr Gly Tyr Met 
355 360 365 



Val Ala Arg Thr Leu Ala Ala Ala Pro Val Val Ala Asn Ala lie He 
370 375 380 



Gin Tyr Leu Gly Ser Glu Arg Ser His Ser Gly Asn Glu Leu Ser Thr 
385 390 395 400 



Ala Val Trp Lys Asp Leu Trp Pro He Glu Arg Arg Arg Gin Arg Glu 
405 410 415 



Phe Phe Cys Phe Gly Met Asp lie Leu Leu Lys Leu Asp Leu Pro Ala 
420 425 430 



Thr Arg Arg Phe Phe Asp Ala Phe Phe Asp Leu Glu Pro Arg Tyr Trp 
435 440 445 



His Gly Phe Leu Ser Ser Arg Leu Phe Leu" Pro Glu Leu He Val Phe 
450 455 460 



Gly Leu Ser Leu Phe Ser His Ala Ser Asn Thr Ser Arg Phe Glu He 
465 470 475 480 



97 



Met Thr Lys Gly Thr Val Pro Leu Val Asn Met lie Asn Asn Leu Leu 
485 490 495 

5 

Gin Asp Lys Glu 
500 

10 

<210> 55 
<211> 1125 
15 <212> DNA 

<213> Lycopersicon esculentum 

20 

<220> 
<221> CDS 
25 <222> (20).. (946) 
<223> 



30 

<400> 55 

ttggtcatct ccacaatca atg get gec gec gec aga ate tec gec tec tct 

Met Ala Ala Ala Ala Arg lie Ser Ala Ser Ser 
15 10 

35 

ace tea cga act ttt tat ttc cgt cat tea ccg ttt ctt ggc cca aaa 
Thr Ser Arg Thr Phe Tyr Phe Arg His Ser Pro Phe Leu Gly Pro Lys 
15 20 25 

40 cct act teg aca ace tea cat gtt tct cca ate tct cct ttt tct ctt 
Pro Thr Ser Thr Thr Ser His Val Ser Pro lie Ser Pro Phe Ser Leu 
30 35 40 

aat eta ggc cca att ttg agg tct aga aga aaa ccc agt ttc act gtt 
45 Asn Leu Gly Pro He Leu Arg Ser Arg Arg Lys Pro Ser Phe Thr Val 
45 50 55 

tgc ttt gtt etc gag gat gag aag ctg aaa cct caa ttt gac gat gag 244 
Cys Phe Val Leu Glu Asp Glu Lys Leu Lys Pro Gin Phe Asp Asp Glu 
50 60 65 70 75 



52 



100 



14 8 



196 



98 

get gag gat ttt gaa aag aag att gag gaa cag ate tta get act cgc 

Ala Glu Asp Phe Glu Lys Lys lie Glu Glu Gin lie Leu Ala Thr Arg 
80 85 90 

ttg gcg gag aaa ctg get agg aag aaa teg gag agg ttt act tat ctt 
Leu Ala Glu Lys Leu Ala Arg Lys Lys Ser Glu Arg Phe Thr Tyr Leu 
95 100 105 

gtg get get ata atg tct agt ttt ggg att act tct atg get gtt atg 
Val Ala Ala lie Met Ser Ser Phe Gly lie Thr Ser Met Ala Val Met 
110 115 120 

get gtt tat tac aga ttt teg tgg caa atg gag gga gga gaa gtt cct 
Ala Val Tyr Tyr Arg Phe Ser Trp Gin Met Glu Gly Gly Glu Val Pro 
125 130 135 

gta acc gaa atg ttg ggt aca ttt get etc tct gtt ggt get get gta 
Val Thr Glu Met Leu Gly Thr Phe Ala Leu Ser Val Gly Ala Ala Val 
140 145 150 155 

gga atg gag ttt tgg gcg aga tgg gca cac aaa gca ctg tgg cat get 
Gly Met Glu Phe Trp Ala Arg Trp Ala His Lys Ala Leu Trp His Ala 
160 165 170 

tea eta tgg cac atg cat gag tea cac cac aaa cca aga gaa gga cct 
Ser Leu Trp His Met His Glu Ser His His Lys Pro Arg «Glu Gly Pro 
175 180 185 

ttt gag ctg aac gac gtt ttc gee ata aca aac get gtt cca gca ata 
Phe Glu Leu Asn Asp Val Phe Ala lie Thr Asn Ala Val Pro Ala lie 
190 195 200 

gee etc etc aac tat ggt ttc ttc cat aaa ggc etc att gee gga eta 
Ala Leu Leu Asn Tyr Gly Phe Phe His Lys Gly Leu lie Ala Gly Leu 
205 210 215 

tgc ttc ggt get ggg eta ggg ate aca gta ttt gga atg gca tac atg 
Cys Phe Gly Ala Gly Leu Gly lie Thr Val Phe Gly Met Ala Tyr Met 
220 225 230 235 

ttt gtt cac gat ggt ttg gtt cac aag aga ttc cca gtt gga cct gta 
Phe Val His Asp Gly Leu Val His Lys Arg Phe Pro Val Gly Pro Val 
240 245 250 

gee aat gta cct tat ctt agg aag gtg get get get cat teg ctt cat 
Ala Asn Val Pro Tyr Leu Arg Lys Val Ala Ala Ala His Ser Leu His 
255 260 265 



cac tea gag aag ttc aat ggt gtc cca tat ggc ttg ttc ttc gga cct 



PF 53863 



99 

His ser Glu Lys Phe Asn Gly Val Pro Tyr Gly Leu Phe Phe Gly Pro 
270 275 280 

aag gaa ctg gaa gaa gta gga ggg acg gaa gag ttg gaa aag gaa gtg 916 
5 Lys Glu Leu Glu Glu Val Gly Gly Thr Glu Glu Leu Glu Lys Glu Val 
285 290 295 

ata cga agg acg aga ctt teg aaa gga tea tgaacgattg ttcataaaca 966 
lie Arg Arg Thr Arg Leu Ser Lys Gly Ser 
10 300 305 

tagaatgtca ttttacactt cttatcaatg aggaagggtg atttttgatg tatttgatag 1026 
tagagaaaaa tgtagctctc ttgatgaaat gaatttgtat ttatgtaggc tcttcttatt 108 6 

15 

cagtaagatt ttttcttttt tttgatctcg tgecgaatt 1125 
<210> 56 

20 

<211> 309 
<212> PRT 
25 <213> Lycopersicon esculentum 



<400> 56 

30 

Met Ala Ala Ala Ala Arg lie Ser Ala Ser Ser Thr Ser Arg Thr Phe 
15 10 15 



35 Tyr Phe Arg His Ser Pro Phe Leu Gly Pro Lys Pro Thr Ser Thr Thr 
20 25 30 



Ser His Val Ser Pro He Ser Pro Phe Ser Leu Asn Leu Gly Pro He 
40 35 40 45 



Leu Arg Ser Arg Arg Lys Pro Ser Phe Thr Val Cys Phe Val Leu Glu 
50 55 60 

45 

Asp Glu Lys Leu Lys Pro Gin Phe Asp Asp Glu Ala Glu Asp Phe Glu 
65 70 75 80 



50 



PF 53863 



100 

Lys Lys lie Glu Glu Gin lie Leu Ala Thr Arg Leu Ala Glu Lys Leu 
85 90 95 



Ala Arg Lys Lys Ser Glu Arg Phe Thr Tyr Leu Val Ala Ala lie Met 
100 105 11° 



Ser Ser Phe Gly lie Thr Ser Met Ala Val Met Ala Val Tyr Tyr Arg 
10 115 120 125 



Phe Ser Trp Gin Met Glu Gly Gly Glu Val Pro Val Thr Glu Met Leu 
130 135 140 

15 

Gly Thr Phe Ala Leu Ser Val Gly Ala Ala Val Gly Met Glu Phe Trp 
145 150 155 160 

20 

Ala Arg Trp Ala His Lys Ala Leu Trp His Ala Ser Leu Trp His Met 
165 170 175 



25 His Glu Ser His His Lys Pro Arg Glu Gly Pro Phe Glu Leu Asn Asp 
180 185 190 



Val Phe Ala lie Thr Asn Ala Val Pro Ala lie Ala Leu Leu Asn Tyr 
30 195 200 205 



Gly Phe Phe His Lys Gly Leu He Ala Gly Leu Cys Phe Gly Ala Gly 
210 215 220 

35 

Leu Gly He Thr Val Phe Gly Met Ala Tyr Met Phe Val His Asp Gly 
225 230 235 240 

40 

Leu Val His Lys Arg Phe Pro Val Gly Pro Val Ala Asn Val Pro Tyr 
245 250 255 



45 Leu Arg Lys Val Ala Ala Ala His Ser Leu His His Ser Glu Lys Phe 
260 265 270 



50 



Asn Gly Val Pro Tyr Gly Leu Phe Phe Gly Pro Lys Glu Leu Glu Glu 
275 280 285 



rr ooooo 



5 



101 



Val Gly Gly Thr Glu Glu Leu Glu Lys Glu Val lie Arg Arg Thr Arg 
290 295 300 



Leu Ser Lys Gly Ser 
305 

10 

<210> 57 
<211> 1666 
15 <212> DNA 

<213> Lycopersicon esculentum 

20 

<220> 

<221> CDS 
25 <222> (1)..(1494) 
<223> 

30 

<400> 57 

atg gaa get ctt etc aag cct ttt cca tct ctt tta ctt tec tct cct 
Met Glu Ala Leu Leu Lys Pro Phe Pro Ser Leu Leu Leu Ser Ser Pro 
15 10 15 

35 

aca ccc cat agg tct att ttc caa caa aat ccc tct ttt eta agt ccc 
Thr Pro His Arg Ser lie Phe Gin Gin Asn Pro Ser Phe Leu Ser Pro 
20 25 30 

40 acc ace aaa aaa aaa tea aga aaa tgt ctt ctt aga aac aaa agt agt 
Thr Thr Lys Lys Lys Ser Arg Lys Cys Leu Leu Arg Asn Lys Ser Ser 
35 40 45 

aaa ctt ttt tgt age ttt ctt gat tta gca ccc aca tea aag cca gag 
45 Lys Leu Phe Cys Ser Phe Leu Asp Leu Ala Pro Thr Ser Lys Pro Glu 
50 55 60 

tct tta gat gtt aac ate tea tgg gtt gat cct aat teg aat egg get 
Ser Leu Asp Val Asn He Ser Trp Val Asp Pro Asn Ser Asn Arg Ala 
50 65 70 75 80 



48 



96 



144 



192 



240 



102 

caa ttc gac gtg ate att ate gga get ggc cct get ggg etc agg eta 288 
Gin Phe Asp Val lie lie He Gly Ala Gly Pro Ala Gly Leu Arg Leu 
85 90 95 

5 

get gaa caa gtt tct aaa tat ggt att aag gta tgt tgt gtt gac cct 336 
Ala Glu Gin Val Ser Lys Tyr Gly He Lys Val Cys Cys Val Asp Pro 
100 105 HO 

10 tea cca etc tec atg tgg cca aat aat tat ggt gtt tgg gtt gat gag 384 
Ser Pro Leu Ser Met Trp Pro Asn Asn Tyr Gly Val Trp Val Asp Glu 
115 120 125 

ttt gag aat tta gga ctg gaa aat tgt tta gat cat aaa tgg cct atg 432 
15 Phe Glu Asn Leu Gly Leu Glu Asn Cys Leu Asp His Lys Trp Pro Met 
130 135 140 

act tgt gtg cat ata aat gat aac aaa act aag tat ttg gga aga cca 48 0 

Thr Cys Val His He Asn Asp Asn Lys Thr Lys Tyr Leu Gly Arg Pro 
20 145 150 155 160 

tat ggt aga gtt agt aga aag aag ctg aag ttg aaa ttg ttg aat agt 
Tyr Gly Arg Val Ser Arg Lys Lys Leu Lys Leu Lys Leu Leu Asn Ser 
165 170 175 

25 

tgt gtt gag aac aga gtg aag ttt tat aaa get aag gtt tgg aaa gtg 576 
Cys Val Glu Asn Arg Val Lys Phe Tyr Lys Ala Lys Val «Trp Lys Val 
180 185 190 

30 gaa cat gaa gaa ttt gag tct tea att gtt tgt gat gat ggt aag aag 624 
Glu His Glu Glu Phe Glu Ser Ser He Val Cys Asp Asp Gly Lys Lys 
195 200 205 

ata aga ggt agt ttg gtt gtg gat gca agt ggt ttt get agt gat ttt 672 
35 He Arg Gly Ser Leu Val Val Asp Ala Ser Gly Phe Ala Ser Asp Phe 
210 215 220 



ata gag tat gac agg cca aga aac cat ggt tat caa att get cat ggg 
He Glu Tyr Asp Arg Pro Arg Asn His Gly Tyr Gin He Ala His Gly 
40 225 230 235 240 

gtt tta gta gaa gtt gat aat cat cca ttt gat ttg gat aaa atg gtg 
Val Leu Val Glu Val Asp Asn His Pro Phe Asp Leu Asp Lys Met Val 
245 250 255 



45 



528 



720 



768 



ctt atg gat tgg agg gat tct cat ttg ggt aat gag cca tat tta agg 816 
Leu Met Asp Trp Arg Asp Ser His Leu Gly Asn Glu Pro Tyr Leu Arg 
260 265 270 



50 



gtg aat aat get aaa gaa cca aca ttc ttg tat gca atg cca ttt gat 



864 



103 

Val Asn Asn Ala Lys Glu Pro Thr Phe Leu Tyr Ala Met Pro Phe Asp 
275 280 285 

aga gat ttg gtt ttc ttg gaa gag act tct ttg gtg agt cgt cct gtt 
Arg Asp Leu Val Phe Leu Glu Glu Thr Ser Leu Val Ser Arg Pro Val 
290 295 300 

tta teg tat atg gaa gta aaa aga agg atg gtg gca aga tta agg cat 
Leu Ser Tyr Met Glu Val Lys Arg Arg Met Val Ala Arg Leu Arg His 
305 310 315 320 

ttg ggg ate aaa gtg aaa agt gtt att gag gaa gag aaa tgt gtg ate 
Leu Gly lie Lys Val Lys Ser Val lie Glu Glu Glu Lys Cys Val lie 
325 330 335 

cct atg gga gga cca ctt ccg egg att cct caa aat gtt atg get att 
Pro Met Gly Gly Pro Leu Pro Arg He Pro Gin Asn Val Met Ala He 
340 345 350 

ggt ggg aat tea ggg ata gtt cat cca tea aca ggg tac atg gtg get 
Gly Gly Asn Ser Gly lie Val His Pro Ser Thr Gly Tyr Met Val Ala 
355 360 365 

agg age atg get tta gca cca gta eta get gaa gee ate gtc gag ggg 
Arg Ser Met Ala Leu Ala Pro Val Leu Ala Glu Ala He Val Glu Gly 
370 375 380 

. « 

ctt ggc tea aca aga atg ata aga ggg tct caa ctt tac cat aga gtt 
Leu Gly Ser Thr Arg Met lie Arg Gly Ser Gin Leu Tyr His Arg Val 
385 390 395 400 

tgg aat ggt ttg tgg cct ttg gat aga aga tgt gtt aga gaa tgt tat 
Trp Asn Gly Leu Trp Pro Leu Asp Arg Arg Cys Val Arg Glu Cys Tyr 
405 410 415 

tea ttt ggg atg gag aca ttg ttg aag ctt gat ttg aaa ggg act agg 
Ser Phe Gly Met Glu Thr Leu Leu Lys Leu Asp Leu Lys Gly Thr Arg 
420 425 430 

aga ttg ttt gac get ttc ttt gat ctt gat cct aaa tac tgg caa ggg 
Arg Leu Phe Asp Ala Phe Phe Asp Leu Asp Pro Lys Tyr Trp Gin Gly 
435 440 445 

ttc ctt tct tea aga ttg tct gtc aaa gaa ctt ggt tta etc age ttg 
Phe Leu Ser Ser Arg Leu Ser Val Lys Glu Leu Gly Leu Leu Ser Leu 
450 455 460 



tgt ctt ttc gga cat ggc tea aac atg act agg ttg gat att gtt aca 
Cys Leu Phe Gly His Gly Ser Asn Met Thr Arg Leu Asp lie Val Thr 
465 470 475 480 



104 



aaa tgt cct ctt cct ttg gtt aga ctg att ggc aat eta gca ata gag 1488 
Lys Cys Pro Leu Pro Leu Val Arg Leu He Gly Asn Leu Ala He Glu 
485 490 495 

5 

age ctt tgaatgtgaa aagtttgaat cattttcttc attttaattt ctttgattat 1544 
Ser Leu 



10 tttcatattt tetcaattge aaaagtgaga taagagctac atactgtcaa caaataaact 1604 
actattggaa agttaaaata tgtgtttgtt gtatgttatt ctaatggaat ggattttgta 1664 
aa 1666 

15 

<210> 58 
<211> 498 

20 

<212> PRT 

<213> Lycopersicon esculentum 
25 ' 

<400> 58 

Met Glu Ala Leu Leu Lys Pro Phe Pro Ser Leu Leu Leu Ser Ser Pro 
30 1 5 10 15 



Thr Pro His Arg Ser He Phe Gin Gin Asn Pro Ser Phe Leu Ser Pro 
20 25 30 

35 

Thr Thr Lys Lys Lys Ser Arg Lys Cys Leu Leu Arg Asn Lys Ser Ser 
35 40 45 

40 

Lys Leu Phe Cys Ser Phe Leu Asp Leu Ala Pro Thr Ser Lys Pro Glu 
50 55 60 



45 Ser Leu Asp Val Asn He Ser Trp Val Asp Pro Asn Ser Asn Arg Ala 
65 70 75 80 



Gin Phe Asp Val He He He Gly Ala Gly Pro Ala Gly Leu Arg Leu 
50 85 90 95 



105 



Ala Glu Gin Val Ser Lys Tyr Gly lie Lys Val Cys Cys Val Asp Pro 
100 105 110 

5 

Ser Pro Leu Ser Met Trp Pro Asn Asn Tyr Gly Val Trp Val Asp Glu 
115 120 125 

10 

Phe Glu Asn Leu Gly Leu Glu Asn Cys Leu Asp His Lys Trp Pro Met 
130 135 140 



15 Thr Cys Val His lie Asn Asp Asn Lys Thr Lys Tyr Leu Gly Arg Pro 
145 150 155 ISO 

Tyr Gly Arg Val Ser Arg Lys Lys Leu Lys Leu Lys Leu Leu Asn Ser 
20 165 170 175 

Cys Val Glu Asn Arg Val Lys Phe Tyr Lys Ala Lys Val Trp Lys Val 
180 185 190 

25 

Glu His Glu Glu Phe Glu Ser Ser He Val Cys Asp Asp .Gly Lys Lys 
195 200 205 

30 

He Arg Gly Ser Leu val Val Asp Ala Ser Gly Phe Ala Ser Asp Phe 
210 215 220 

35 He Glu Tyr Asp Arg Pro Arg Asn His Gly Tyr Gin He Ala His Gly 
225 ~ 230 235 240 

Val Leu Val Glu Val Asp Asn His Pro Phe Asp Leu Asp Lys Met Val 
40 245 250 255 

Leu Met Asp Trp Arg Asp Ser His Leu Gly Asn Glu Pro Tyr Leu Arg 
260 265 270 

45 

val Asn Asn Ala Lys Glu Pro Thr Phe Leu Tyr Ala Met Pro Phe Asp 
275 280 285 



50 



106 

Arg Asp Leu Val Phe Leu Glu Glu Thr Ser Leu Val Ser Arg Pro Val 
290 295 300 



Leu Ser Tyr Met Glu Val Lys Arg Arg Met Val Ala Arg Leu Arg His 
305 310 315 320 



Leu Gly lie Lys Val Lys Ser Val He Glu Glu Glu Lys Cys Val He 
325 330 335 



Pro Met Gly Gly Pro Leu Pro Arg He Pro Gin Asn Val Met Ala He 
340 345 350 



Gly Gly Asn Ser Gly He Val His Pro Ser Thr Gly Tyr Met Val Ala 
355 360 365 



Arg Ser Met Ala Leu Ala Pro Val Leu Ala Glu Ala He Val Glu Gly 
370 375 380 



Leu Gly Ser Thr Arg Met He Arg Gly Ser Gin Leu Tyr His Arg Val 
385 390 395 400 



Trp Asn Gly Leu Trp Pro Leu Asp Arg Arg Cys Val Arg Glu Cys Tyr 
405 410 415 



Ser Phe Gly Met Glu Thr Leu Leu Lys Leu Asp Leu Lys Gly Thr Arg 
420 425 430 



Arg Leu Phe Asp Ala Phe Phe Asp Leu Asp Pro Lys Tyr Trp Gin Gly 
435 440 445 



Phe Leu Ser Ser Arg Leu Ser Val Lys Glu Leu Gly Leu Leu Ser Leu 
450 455 460 



Cys Leu Phe Gly His Gly Ser Asn Met Thr Arg Leu Asp He val Thr 
465 470' 475 480 



Lys Cys Pro Leu Pro Leu Val Arg Leu He Gly Asn Leu Ala He Glu 
485 490 495 



HI- 53863 
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Ser Leu 



<210> 59 

<211> 37 

<212> DNA 

<213> Kiinstliche Sequenz 



<220> 

<221> Primer 
<222> (1) . . (37) 
<223> 



<400> 59 

gcgcatgcat ctagaaatga tccagttaga acaacca 



<210> 60 

<211> 37 

<212> DNA 

<213> Kunstliche Sequenz 



<220> 

<221> Primer 
<222> (1) . . (37) 
<223> 



PF 53863 
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<400> 60 

gcgcatgctc tagactattt tgctttgtaa atttctg 



5 <210> 61 

<211> 792 

<212> DNA 

10 

<213> Nostoc punctiforme ATCC 29133 



15 <220> 

<221> CDS 

<222> (5).. (775) 

20 

<223> 



25 <400> 61 

gcgc atg cat eta gaa atg ate cag tta gaa caa cca etc agt cat caa 

Met His Leu Glu Met lie Gin Leu Glu Gin Pro Leu Ser His Gin 
15 10 15 

30 gca aaa ctg act cca gta ctg aga agt aaa tct cag ttt aag ggg ctt 
Ala Lys Leu Thr Pro Val Leu Arg Ser Lys Ser Gin Phe Lys Gly Leu 
20 25 30 

ttc att get att gtc att gtt age gca tgg gtc att age ctg agt tta 
35 Phe lie Ala lie Val He Val Ser Ala Trp Val He Ser Leu Ser Leu 
35 40 45 

tta ctt tec ctt gac ate tea aag eta aaa ttt tgg atg tta ttg cct 
Leu Leu Ser Leu Asp He Ser Lys Leu Lys Phe Trp Met Leu Leu Pro 
40 50 55 60 

gtt ata eta tgg caa aca ttt tta tat acg gga tta ttt att aca tct 
Val He Leu Trp Gin Thr Phe Leu Tyr Thr Gly Leu Phe He Thr Ser 
65 70 75 

45 

cat gat gec atg cat ggc gta gta ttt ccc caa aac acc aag att aat 
His Asp Ala Met His Gly Val Val Phe Pro Gin Asn Thr Lys He Asn 
80 85 90 95 

50 cat ttg att gga aca ttg acc eta tec ctt tat ggt ctt tta cca tat 



49 



97 



145 



193 



241 



289 



337 



35 



tgg tgg tea ttt ate acg tgc tat cat ttt ggc tac cac gag gaa cat 
Trp Trp Ser Phe He Thr Cys Tyr His Phe Gly Tyr His Glu Glu His 
225 230 235 

cac gaa tat cct cat att tct tgg tgg cag tta cca gaa att tac aaa 
His Glu Tyr Pro His He Ser Trp Trp Gin Leu Pro Glu He Tyr Lys 
240 245 250 255 

40 gca aaa tagtctagag catgege 
Ala Lys 



385 



109 

His Leu He Gly Thr Leu Thr Leu Ser Leu Tyr Gly Leu Leu Pro Tyr 
100 105 11° 

caa aaa eta ttg aaa aaa cat tgg tta cac cac cac aat cca gca age 
5 Gin Lys Leu Leu Lys Lys His Trp Leu His His His Asn Pro Ala Ser 
115 120 125 

tea ata gac ccg gat ttt cac aat ggt aaa cac caa agt ttc ttt get 43 3 

Ser He Asp Pro Asp Phe His Asn Gly Lys His Gin Ser Phe Phe Ala 
10 130 135 140 

tgg tat ttt cat ttt atg aaa ggt tac tgg agt tgg ggg caa ata att 481 

Trp Tyr Phe His Phe Met Lys Gly Tyr Trp Ser Trp Gly Gin He He 
145 150 155 

15 

gcg ttg act att att tat aac ttt get aaa tac ata etc cat ate cca 

Ala Leu Thr He He Tyr Asn Phe Ala Lys Tyr He Leu His He Pro 

160 165 170 175 

20 agt gat aat eta act tac ttt tgg gtg eta ccc teg ctt tta agt tea 
Ser Asp Asn Leu Thr Tyr Phe Trp Val Leu Pro Ser Leu Leu Ser Ser 
180 185 190 

tta caa tta ttc tat ttt ggt act ttt tta ccc cat agt gaa cca ata 
25 Leu Gin Leu Phe Tyr Phe Gly Thr Phe Leu Pro His Ser Glu Pro He ' 
195 200 205 

ggg ggt tat gtt cag cct cat tgt gee caa aca att age cgt cct att 673 
Gly Gly Tyr Val Gin Pro His Cys Ala Gin Thr He Ser Arg Pro He 
30 210 215 220 



529 



577 



625 



721 



769 



792 



45 <210> 62 



<211> 257 



<212> PRT 



50 



110 

<213> Nostoc punctiforme ATCC 29133 



5 <400> 62 



Met His Leu Glu Met He Gin Leu Glu Gin Pro Leu Ser His Gin Ala 



10 « 



10 

Lys Leu Thr Pro Val Leu Arg Ser Lys Ser Gin Phe Lys Gly Leu Phe 
20 



25 30 



15 He Ala lie val He Val Ser Ala Trp Val He Ser Leu Ser Leu Leu 

40 45 



35 



Leu Ser Leu Asp He Ser Lys Leu Lys Phe Trp Met Leu Leu Pro Val 
20 50 55 60 



He Leu Trp Gin Thr Phe Leu Tyr Thr Gly Leu Phe He Thr Ser His 
65 

25 



70 75 



Asp Ala Met His Gly Val Val Phe Pro Gin Asn Thr Lys .He Asn His 
85 90 9 s 

30 

Leu He Gly Thr Leu Thr Leu Ser Leu Tyr Gly Leu Leu Pro Tyr Gin 



100 



105 HO 



35 Lys Leu Leu Lys Lys His Trp Leu His His His Asn Pro Ala Ser Ser 
115 120 125 

He Asp Pro Asp Phe His Asn Gly Lys His Gin Ser Phe Phe Ala Trp 
40 130 135 I 40 



Tyr Phe His Phe Met Lys Gly Tyr Trp Ser Trp Gly Gin He He Ala 
14S 150 155 

45 

Leu Thr He He Tyr Asn Phe Ala Lys Tyr He Leu His He Pro Ser 
165 170 i75 



50 



111 

Asp Asn Leu Thr Tyr Phe Trp Val Leu Pro Ser Leu Leu Ser Ser Leu 
180 185 190 

Gin Leu Phe Tyr Phe Gly Thr Phe Leu Pro His Ser Glu Pro lie Gly 
195 200 205 

Gly Tyr Val Gin Pro His Cys Ala Gin Thr lie Ser Arg Pro lie Trp 
210 215 220 

Trp Ser Phe lie Thr Cys Tyr His Phe Gly Tyr His Glu Glu His His 
225 230 235 240 

Glu Tyr Pro His He Ser Trp Trp Gin Leu Pro Glu He Tyr Lys Ala 
245 250 255 

Lys 

<210> 63 
<211> 26 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<221> Primer 
<222> (1) . . (26) 
<223> 

<400> 63 

gtcgaccctg ctttaatgag atatgc 



<210> 64 



rr oooao 

112 

<211> 27 
<212> DNA 
5 <213> Kunstliche Sequenz 



<220> 

10 

<221> Primer 
<222> (1) . . (27) 
15 <223> 



<400> 64 
20 ctcgagcttg gacaatcagt aaattga 



27 



<210> 65 

25 <211> 210 

<212> DNA 

<213> Agrobacterium tumef aciens 

30 

<220> 

35 <22l> Terminator 
<222> (1)..(210) 



<223> 



40 



45 



<400> 65 

gtcgaccctg ctttaatgag atatgcgaga cgcctatgat cgcatgatat ttgctttcaa 6 0 

ttctgttgtg cacgttgtaa aaaacctgag catgtgtagc tcagatcctt accgccggtt 12 0 

tcggttcatt ctaatgaata tatcacccgt tactatcgta tttttatgaa taatattctc 18 0 

50 cgttcaattt actgattgtc caag'ctcgag 210 



rr 3ooov» 

113 



<210> 66 

<211> 35 

<212> DNA 

<213> Kunstliche Sequenz 



<220> 

<221> Primer 
<222> (1) . . (35) 
<223> 



<400> 66 

gcgcatgcat ctagaaatgg ttcagtgtca accat 



<210> 67 

<211> 35 

<212> DNA 

<213> Kunstliche Sequenz 



<220> 

<221> Primer 
<222> (1) . . (35) 
<223> 



<400> 67 

gcgcatgctc tagaccttat aaagatattt tgtga 



rr ooooo 



114 

<210> 68 
<211> 809 
<212> DNA 

<213> Nostoc PCC 7120 



<220> 

<221> CDS 

<222> (5) . . (790) 

<223> 



<400> 68 

gcgc atg cat eta gaa atg gtt cag tgt caa cca tea tct ctg cat tea 

Met His Leu Glu Met Val Gin Cys Gin Pro Ser Ser Leu His Ser 
15 10 15 

gaa aaa ctg gtg tta ttg tea teg aca ate aga gat gat aaa aat att 
Glu Lys Leu Val Leu Leu Ser Ser Thr lie Arg Asp Asp 'Lys Asn lie 
20 25 30 

aat aag ggt ata ttt att gee tgc ttt ate tta ttt tta tgg gca att 
Asn Lys Gly lie Phe lie Ala Cys Phe lie Leu Phe Leu Trp Ala lie 
35 40 45 

agt tta ate tta tta etc tea ata gat aca tec ata att cat aag age 
Ser Leu lie Leu Leu Leu Ser He Asp Thr Ser He He His Lys Ser 
50 55 60 

tta tta ggt ata gee atg ctt tgg cag ace ttc tta tat aca ggt tta 
Leu Leu Gly He Ala Met Leu Trp Gin Thr Phe Leu Tyr Thr Gly Leu 
65 70 75 

ttt att act get cat gat gee atg cac ggc gta gtt tat ccc aaa aat 
Phe He Thr Ala His Asp Ala Met His Gly Val Val Tyr Pro Lys Asn 
80 85 90 95 

ccc aga ata aat aat ttt ata ggt aag etc act eta ate ttg tat gga 
Pro Arg He Asn Asn Phe He Gly Lys Leu Thr Leu He Leu Tyr Gly 
100 105 110 

eta etc cct tat aaa gat tta ttg aaa aaa cat tgg tta cac cac gga 



115 

Leu Leu Pro Tyr Lys Asp Leu Leu Lys Lys His Trp Leu His His Gly 
115 120 125 

cat cct ggt act gat tta gac cct gat tat tac aat ggt cat ccc caa 433 
5 His Pro Gly Thr Asp Leu Asp Pro Asp Tyr Tyr Asn Gly His Pro Gin 
130 135 140 



aac ttc ttt ctt tgg tat eta cat ttt atg aag tct tat tgg cga tgg 
Asn Phe Phe Leu Trp Tyr Leu His Phe Met Lys Ser Tyr Trp Arg Trp 
10 145 150 155 

acg caa att ttc gga tta gtg atg att ttt cat gga ctt aaa aat ctg 
Thr Gin He Phe Gly Leu Val Met He Phe His Gly Leu Lys Asn Leu 
160 165 170 175 

15 

gtg cat ata cca gaa aat aat tta att ata ttt tgg atg ata cct tct 
Val His He Pro Glu Asn Asn Leu He He Phe Trp Met He Pro Ser 
180 185 190 

20 att tta agt tea gta caa eta ttt tat ttt ggt aca ttt ttg cct cat 
He Leu Ser Ser Val Gin Leu Phe Tyr Phe Gly Thr Phe Leu Pro His 
195 200 205 

aaa aag eta gaa ggt ggt tat act aac ccc cat tgt gcg cgc agt ate 
25 Lys Lys Leu Glu Gly Gly Tyr Thr Asn Pro His Cys Ala Arg Ser He 
210 215 220 

cca tta cct ctt ttt tgg tct ttt gtt act tgt tat cac ttc ggc tac 
Pro Leu Pro Leu Phe Trp Ser Phe Val Thr Cys Tyr His Phe Gly Tyr 
30 225 230 235 

cac aag gaa cat cac gaa tac cct caa ctt cct tgg tgg aaa tta cct 
His Lys Glu His His Glu Tyr Pro Gin Leu Pro Trp Trp Lys Leu Pro 
240 245 250 255 



35 



gaa get cac aaa ata tct tta taaggtctag ageatgege 
Glu Ala His Lys He Ser Leu 
260 



40 



<210> 69 

<211> 262 

45 <212> PRT 

<213> NOStQC PCC 7120 



481 



529 



577 



625 



673 



721 



769 



809 



50 



PF 53863 
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<400> 69 

Met His Leu Glu Met Val Gin Cys Gin Pro Ser Ser Leu His Ser Glu 
15 10 15 

5 

Lys Leu Val Leu Leu Ser Ser Thr He Arg Asp Asp Lys Asn He Asn 
20 25 30 

10 

Lys Gly He Phe He Ala Cys Phe He Leu Phe Leu Trp Ala He Ser 
35 40 45 



15 Leu He Leu Leu Leu Ser He Asp Thr Ser He He His Lys Ser Leu 
50 55 60 



Leu Gly He Ala Met Leu Trp Gin Thr Phe Leu Tyr Thr Gly Leu Phe 
20 65 70 75 80 



He Thr Ala His Asp Ala Met His Gly Val Val Tyr Pro Lys Asn Pro 
85 90 95 

25 

Arg He Asn Asn Phe He Gly Lys Leu Thr Leu He Leu«Tyr Gly Leu 
100 105 HO 

30 

Leu Pro Tyr Lys Asp Leu Leu Lys Lys His Trp Leu His His Gly His 
115 120 125 



35 Pro Gly Thr Asp Leu Asp Pro Asp Tyr Tyr Asn Gly His Pro Gin Asn 
130 135 140 



Phe Phe Leu Trp Tyr Leu His Phe Met Lys Ser Tyr Trp Arg Trp Thr 
40 145 150 155 160 



Gin He Phe Gly Leu Val Met He Phe His Gly Leu Lys Asn Leu Val 
165 170 175 

45 

His He Pro Glu Asn Asn Leu He He Phe Trp Met He Pro Ser He 
180 185 190 



50 



117 

Leu Ser Ser Val Gin Leu Phe Tyr Phe Gly Thr Phe Leu Pro His Lys 
195 200 205 



5 Lys Leu Glu Gly Gly Tyr Thr Asn Pro His Cys Ala Arg Ser He Pro 
210 215 220 



Leu Pro Leu Phe Trp Ser Phe Val Thr Cys Tyr His Phe Gly Tyr His 
10 225 230 235 240 



Lys Glu His His Glu Tyr Pro Gin Leu Pro Trp Trp Lys Leu Pro Glu 
245 250 255 

15 

Ala His Lys lie Ser Leu 
260 

20 

<210> 70 
<211> 39 
25 <212> DNA 

<213> Kunstliche Sequenz 

30 

<220> 

<221> Primer 
35 <222> (1) . . (39) 
<223> 



40 

<400> 70 

gcgcatgcat ctagaaatga atttttgtga taaaccagt 



45 <210> 71 

<211> 37 

<212> DNA 

50 



<213> Kunstliche Sequenz 



118 



5 <220> 

<221> Primer 
<222> (1)..(37) 

10 

<223> 



15 <400> 71 

gcgcatgctc tagattacga attggttact gaattgt 37 



<210> 72 

20 

<211> 819 



<212> DNA 

25 <213> Nostoc punctiforme ATCC 29133 



<220> 

30 

<221> CDS 
<222> (5).. (802) 
35 <223> 



<400> 72 

40 gcgc atg cat eta gaa atg aat ttt tgt gat aaa cca gtt age tat tat 

Met His Leu Glu Met Asn Phe Cys Asp Lys Pro Val Ser Tyr Tyr 

1 5 10 15 

gtt gca ata gag caa tta agt get aaa gaa gat act gtt tgg ggg ctg 
45 Val Ala He Glu Gin Leu Ser Ala Lys Glu Asp Thr Val Trp Gly Leu 

20 25 30 



49 



97 



gtg att gtc ata gta att att agt ctt tgg gta get agt ttg get ttt 145 
Val He Val He Val He He Ser Leu Trp Val Ala Ser Leu Ala Phe 
50 35 40 45 



PF 53863 



119 



tta eta get att aat tat gec aaa gtc cca att tgg ttg ata cct att 
Leu Leu Ala He Asn Tyr Ala Lys Val Pro He Trp Leu He Pro He 
50 55 60 

5 

gca ata gtt tgg caa atg ttc ctt tat aca ggg eta ttt att act gca 
Ala lie Val Trp Gin Met Phe Leu Tyr Thr Gly Leu Phe He Thr Ala 
65 70 75 

10 cat gat get atg cat ggg tea gtt tat cgt aaa aat ccc aaa att aat 
His Asp Ala Met His Gly Ser Val Tyr Arg Lys Asn Pro Lys He Asn 
80 85 90 95 

aat ttt ate ggt tea eta get gta gcg ctt tac get gtg ttt cca tat 
15 Asn Phe He Gly Ser Leu Ala Val Ala Leu Tyr Ala Val Phe Pro Tyr 

100 105 HO 

caa cag atg tta aag aat cat tgc tta cat cat cgt cat cct get age 
Gin Gin Met Leu Lys Asn His Cys Leu His His Arg His Pro Ala Ser 
20 H5 120 125 

gaa gtt gac cca gat ttt cat gat ggt aag aga aca aac get att ttc 
Glu Val Asp Pro Asp Phe His Asp Gly Lys Arg Thr Asn Ala He Phe 
130 135 140 



25 



45 



tgg tat etc cat ttc atg ata gaa tac tec agt tgg caa cag tta ata 
Trp Tyr Leu His Phe Met He Glu Tyr Ser Ser Trp Gin. Gin Leu He 
145 150 155 



30 gta eta act ate eta ttt aat tta get aaa tac gtt ttg cac ate cat 
Val Leu Thr He Leu Phe Asn Leu Ala Lys Tyr Val Leu His He His 
160 165 170 175 

caa ata aat etc ate tta ttt tgg agt att cct cca att tta agt tec 
35 Gin He Asn Leu He Leu Phe Trp Ser He Pro Pro He Leu Ser Ser 

180 185 190 

att caa ctg ttt tat ttc gga aca ttt ttg cct cat cga gaa ccc aag 
He Gin Leu Phe Tyr Phe Gly Thr Phe Leu Pro His Arg Glu Pro Lys 
40 195 200 205 

aaa gga tat gtt tat ccc cat tgc age caa aca ata aaa ttg cca act 
Lys Gly Tyr Val Tyr Pro His Cys Ser Gin Thr He Lys Leu Pro Thr 
210 215 220 



193 



241 



289 



337 



385 



433 



481 



529 



577 



625 



673 



ttt ttg tea ttt ate get tgc tac cac ttt ggt tat cat gaa gaa cat 721 
Phe Leu Ser Phe He Ala Cys Tyr His Phe Gly Tyr His Glu Glu His 
225 230 235 



50 



cat gag tat ccc cat gta cct tgg tgg caa ctt cca tct gta tat 



aag 769 



120 

His Glu Tyr Pro His Val Pro Trp Trp Gin Leu Pro Ser Val Tyr Lys 
240 245 250 255 

cag aga gta ttc aac aat tea gta acc aat teg taatctagag catgege 
5 Gin Arg Val Phe Asn Asn Ser Val Thr Asn Ser 

260 265 



<210> 73 

10 

<211> 266 

<212> PRT 

15 <213> Nostoc punctiforme ATCC 29133 



<400> 73 

20 

Met His Leu Glu Met Asn Phe Cys Asp Lys Pro Val Ser Tyr Tyr Val 
IS 10 15 



25 Ala lie Glu Gin Leu Ser Ala Lys Glu Asp Thr Val Trp Gly Leu Val s 
20 25 30 



lie Val He Val He He Ser Leu Trp Val Ala Ser Leu Ala Phe Leu 
30 35 40 45 



Leu Ala He Asn Tyr Ala Lys Val Pro He Trp Leu He Pro He Ala 
50 55 60 

35 

He Val Trp Gin Met Phe Leu Tyr Thr Gly Leu Phe He Thr Ala His 
65 * 70 75 80 

40 

Asp Ala Met His Gly Ser Val Tyr Arg Lys Asn Pro Lys He Asn Asn 
85 90 95 



45 Phe He Gly Ser Leu Ala Val Ala Leu Tyr Ala Val Phe Pro Tyr Gin 
100 105 HO 



• Gin Met Leu Lys Asn His Cys Leu His His Arg His Pro Ala Ser Glu 
50 115 120 125 



819 



121 



Val Asp Pro Asp Phe His Asp Gly Lys Arg Thr Asn Ala He Phe Trp 
130 135 140 



Tyr Leu His Phe Met He Glu Tyr Ser Ser Trp Gin Gin Leu He Val 
145 150 155 160 



Leu Thr He Leu Phe Asn Leu Ala Lys Tyr Val Leu His He His Gin 
165 170 175 



He Asn Leu He Leu Phe Trp Ser He Pro Pro He Leu Ser Ser He 
180 185 190 



Gin Leu Phe Tyr Phe Gly Thr Phe Leu Pro His Arg Glu Pro Lys Lys 
195 200 205 



Gly Tyr Val Tyr Pro His Cys Ser Gin Thr He Lys Leu Pro Thr Phe 
210 215 220 



Leu Ser Phe He Ala Cys Tyr His Phe Gly Tyr His Glu .Glu His His 
225 230 235 240 



Glu Tyr Pro His Val Pro Trp Trp Gin Leu Pro Ser Val Tyr Lys Gin 
245 250 255 



Arg Val Phe Asn Asn Ser Val Thr Asn Ser 
260 265 



<210> 74 

<211> 33 

<212> DNA 

<213> Kunstliche Sequenz 



<220> 



PF 53863 



122 

<221> Primer 
<222> (1) . . (33) 
5 <223> 



<400> 74 

10 gcgcatgcat ctagaaatgg cgatcgccat tat 



<210> 75 

15 <211> 32 

<212> DNA 

<213> Kiinstliche Sequenz 

20 

<220> 

25 <22l> Primer 

<222> (1) . - (32) 
<223> 



30 



35 



40 



45 



<400> 75 

gcgcatgctc tagatcacaa atttgattta ga 



<210> 76 

<211> 720 

<212> DNA 

<213> Nodularia spumigena NSOR10 
<220> 

<221> CDS 



50 



123 



<222> (5) . . (703) 



<223> 



<400> 76 

gcgc atg cat eta gaa atg gcg ate gee att att agt ata tgg get ate 

Met His Leu Glu Met Ala lie Ala lie lie Ser lie Trp Ala lie 

15 10 15 

age eta ggt ttg tta ctt tat att gat ata tec caa ttc aag ttt tgg 
Ser Leu Gly Leu Leu Leu Tyr lie Asp lie Ser Gin Phe Lys Phe Trp 
20 25 30 

atg ttg tta ccg etc ata ttt tgg caa aca ttt tta tat acg gga tta 
Met Leu Leu Pro Leu lie Phe Trp Gin Thr Phe Leu Tyr Thr Gly Leu 
35 40 45 

ttt att aca get cat gat gec atg cat ggg gta gtt ttt ccc aaa aat 
Phe He Thr Ala His Asp Ala Met His Gly Val Val Phe Pro Lys Asn 
50 55 60 

ccc aaa ate aac cat ttc att ggc tea ttg tgc ctg ttt ctt tat ggt 
Pro Lys He Asn His Phe He Gly Ser Leu Cys Leu Phe Leu Tyr Gly 
65 70 75 

ctt tta cct tat caa aaa ctt tta aaa aag cat tgg eta cat cac cat 
Leu Leu Pro Tyr Gin Lys Leu Leu Lys Lys His Trp Leu His His His 
80 85 90 95 

aat cca gee agt gaa aca gat cca gat ttt cac aac ggg aag cag aaa 
Asn Pro Ala Ser Glu Thr Asp Pro Asp Phe His Asn Gly Lys Gin Lys 
100 105 110 

aac ttt ttt get tgg tat tta tat ttt atg aag cgt tac tgg agt tgg 
Asn Phe Phe Ala Trp Tyr Leu Tyr Phe Met Lys Arg Tyr Trp Ser Trp 
115 120 125 

tta caa att ate aca tta atg att att tat aac tta eta aaa tat ata 
Leu Gin He He Thr Leu Met He He Tyr Asn Leu Leu Lys Tyr He 
130 135 140 

tgg cat ttt cca gag gat aat atg act tat ttt tgg gta gtt ccc tea 
Trp His Phe Pro Glu Asp Asn Met Thr Tyr Phe Trp Val Val Pro Ser 
145 150 155 



att tta agt tct tta caa tta ttt tat ttt gga act ttt eta ccc cac 
He Leu Ser Ser Leu Gin Leu Phe Tyr Phe Gly Thr Phe Leu Pro His 
160 165 ' 170 175 



124 

agt gag cct gta gaa ggt tat aaa gag cct cat cgt tec caa act att 
Ser Glu Pro Val Glu Gly Tyr Lys Glu Pro His Arg Ser Gin Thr lie 
180 185 190 

age cgt ccc att tgg tgg tea ttt ata act tgt tac cat ttt ggt tat 
Ser Arg Pro lie Trp Trp Ser Phe lie Thr Cys Tyr His Phe Gly Tyr 
195 200 205 

cat tac gaa cat cat gaa tac ccc cat gtt cct tgg tgg caa_ tta cca 
His Tyr Glu His His Glu Tyr Pro His Val Pro Trp Trp Gin Leu Pro 
210 215 220 

gaa att tat aaa atg tct aaa tea aat ttg tgatctagag catgege 
Glu lie Tyr Lys Met Ser Lys Ser Asn Leu 
225 230 



<210> 77 
<211> 233 
<212> PRT 

<213> Nodularia spumigena NSOR10 
<400> 77 

Met His Leu Glu Met Ala lie Ala lie lie Ser lie Trp Ala lie Ser 
15 10 15 



Leu Gly Leu Leu Leu Tyr lie Asp lie Ser Gin Phe Lys Phe Trp Met 
20 25 30 



Leu Leu Pro Leu He Phe Trp Gin Thr Phe Leu Tyr Thr Gly Leu Phe 
35 40 45 



He Thr Ala His Asp Ala Met His Gly Val Val Phe Pro Lys Asn Pro 
50 55 60 



Lys He Asn His Phe He Gly Ser Leu Cys Leu Phe Leu Tyr Gly Leu 
65 70 75 80 



125 

Leu Pro Tyr Gin Lys Leu Leu Lys Lys His Trp Leu His His His Asn 
85 90 95 



Pro Ala Ser Glu Thr Asp Pro Asp Phe His Asn Gly Lys Gin Lys Asn 
100 105 110 



Phe Phe Ala Trp Tyr Leu Tyr Phe Met Lys Arg Tyr Trp Ser Trp Leu 
115 120 125 



Gin lie lie Thr Leu Met lie He Tyr Asn Leu Leu Lys Tyr He Trp 
130 135 140 



His Phe Pro Glu Asp Asn Met Thr Tyr Phe Trp Val Val Pro Ser He 
145 150 155 160 



Leu Ser Ser Leu Gin Leu Phe Tyr Phe Gly Thr Phe Leu Pro His Ser 
165 170 175 



Glu Pro Val Glu Gly Tyr Lys Glu Pro His Arg Ser Gin Thr lie Ser 
180 185 190 



Arg Pro lie Trp Trp Ser Phe He Thr Cys Tyr His Phe Gly Tyr His 
195 200 205 



Tyr Glu His His Glu Tyr Pro His Val Pro Trp Trp Gin Leu Pro Glu 
210 215 220 



He Tyr Lys Met Ser Lys Ser Asn Leu 
225 230 



<210> 78 
<211> 24 
<212> DNA 



<213> Kunstliche Sequenz 



PF 53863 
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<220> 

<221> Primer 
5 <222> (1) . . (24) 
<223> 



10 



20 



30 



40 



<400> 78 

gaattcctgc aatagaatgt tgag 24 



15 <210> 79 

<211> 25 

<212> DNA 

<213> Kunstlictie Sequenz 



25 <220> 

<221> Primer 
<222> (1) . . (25) 
<223> 



35 <400> 79 

ctcgagctta cgagcatttt ctaag 25 



<210> 80 

<211> 307 

<212> DNA 

45 <213> Vicia faba 



<220> 



50 



127 

<221> Terminator 
<222> (1) . . (307) 
5 <223> 



<400> 80 

10 gaattcctgc aatagaatgt tgaggtgacc actttctgta ataaaataat tataaaataa 60 

atttagaatt gctgtagtca agaacatcag ttctaaaata ttaataaagt tatggccttt 12 0 

tgacatatgt gtttcgataa aaaaatcaaa ataaattgag atttattcga aatacaatga 180 

15 

aagtttgcag atatgagata tgtttctaca aaataataac ttaaaactca actatatgct 240 

aatgtttttc ttggtgtgtt tcatagaaaa ttgtatccgt ttcttagaaa atgctcgtaa 300 
20 gctcgag 3 07 



<210> 81 
25 <211> 26 
<212> DNA 

<213> Kunstliche Sequenz 

30 

<220> 
35 <221> Primer 

<222> (1) . . (26) 
<223> 

40 



45 



<400> 81 

aagcttgaat ttggatccgc caccgt 2 6 



<210> 82 
<211> 25 



<212> DNA 



128 



10 



15 



20 



30 



<213> Kunstliche Sequenz 



<220> 



<22l> Primer 



<222> (1)..(25) 



<223> 



<400> 82 

gaattcccaa taataatcta cagcc 



<210> 83 



25 



<211> 1040 
25 <212> DNA 

<213> Lycopersicon esculentum 



<220> 



<221> CDS 
35 <222> (29) . . (970) 
<223> 



40 



45 



<400> 83 

aagcttgaat ttggatccgc caccgtcc atg gcg gcc gga att tea gec tec 

Met Ala Ala Gly He Ser Ala Ser 

1 5 

get agt tec cga acc att cgc etc cgt cat aac ccg ttt etc agt cca 
Ala Ser Ser Arg Thr He Arg Leu Arg His Asn Pro Phe Leu Ser Pro 
10 15 20 



52 



100 



50 aaa tec gcc tea acc gcc ccg ccg gtt ctg ttc ttc tct ccg tta act 



14 8 



129 

Lys Ser Ala Ser Thr Ala Pro Pro Val Leu Phe Phe Ser Pro Leu Thr 
25 30 35 40 

cgc aat ttt ggc gca att ttg ctg tct aga aga aag ccg aga ttg gcg 196 
5 Arg Asn Phe Gly Ala He Leu Leu Ser Arg Arg Lys Pro Arg Leu Ala 

45 50 55 

gtt tgt ttt gtg ctg gag aat gag aaa ttg aat agt act ate gaa agt 244 
Val Cys Phe Val Leu Glu Asn Glu Lys Leu Asn Ser Thr He Glu Ser 
10 60 65 70 

gag agt gaa gta ata gag gat egg ata caa gta gag att aat gag gag 292 
Glu Ser Glu Val He Glu Asp Arg He Gin Val Glu He Asn Glu Glu 
75 80 85 

15 

aag agt tta get gec agt tgg ctg gcg gag aaa ttg gcg agg aag aaa 34 0 

Lys Ser Leu Ala Ala Ser Trp Leu Ala Glu Lys Leu Ala Arg Lys Lys 
90 95 100 

20 teg gag agg ttt act tat ctt gtg gca get gtg atg tct agt ttg ggg 388 
Ser Glu Arg Phe Thr Tyr Leu Val Ala Ala Val Met Ser Ser Leu Gly 
105 110 115 120 

att act tct atg gcg att ttg gcg gtt tat tac aga ttt tea tgg caa 43 6 

25 He Thr Ser Met Ala He Leu Ala Val Tyr Tyr Arg Phe Ser Trp Gin 

125 130 135 

atg gag ggt gga gaa gtg cct ttt tct gaa atg tta get aca ttc act 484 
Met Glu Gly Gly Glu Val Pro Phe Ser Glu Met Leu Ala Thr Phe Thr 
30 140 145 150 

etc teg ttt ggc get gee gta gga atg gag tac tgg gcg aga tgg get 532 
Leu Ser Phe Gly Ala Ala Val Gly Met Glu Tyr Trp Ala Arg Trp Ala 
155 160 165 

35 

cat aga gca eta tgg cat get tct tta tgg cac atg cac gag teg cac 580 
His Arg Ala Leu Trp His Ala Ser Leu Trp His Met His Glu Ser His 
170 175 180 

40 cat aga cca aga gaa gga cct ttt gag atg aac gac gtt ttc gee ata 628 
His Arg Pro Arg Glu Gly Pro Phe Glu Met Asn Asp Val Phe Ala He 
185 190 195 200 

aca aat get gtt cca get ata ggt ctt ctt tec tac ggt ttc ttc cat 676 
45 Thr Asn Ala Val Pro Ala He Gly Leu Leu Ser Tyr Gly Phe Phe His 

205 210 215 

aaa ggg ate gtc cct ggc etc tgt ttc ggc get gga ttg ggg ate aca 724 
Lys Gly He Val Pro Gly Leu Cys Phe Gly Ala Gly Leu Gly He Thr 
50 220 225 230 



130 

gta ttt ggg atg get tac atg ttc gtt cac gat gga ctg gtt cat aag 
Val Pile Gly Met Ala Tyr Met Phe Val His Asp Gly Leu Val His Lys 
235 240 245 

aga ttt ccc gta ggg cct att gec aac gtg cct tac ttt egg agg gta 
Arg Phe Pro Val Gly Pro lie Ala Asn Val Pro Tyr Phe Arg Arg Val 
250 255 260 

get gca gca cat cag ctt cat cac teg gac aaa ttt gat ggt gtc cca 
Ala Ala Ala His Gin Leu His His Ser Asp Lys Phe Asp Gly Val Pro 
265 270 275 280 

tat ggc ttg ttt eta gga cct aag gaa ttg gaa gaa gta gga gga ctt 
Tyr Gly Leu Phe Leu Gly Pro Lys Glu Leu Glu Glu Val Gly Gly Leu 
285 290 295 

gaa gag tta gaa aag gaa gtc aac cga agg att aaa att tct aag gga 
Glu Glu Leu Glu Lys Glu Val Asn Arg Arg lie Lys lie Ser Lys Gly 
300 305 310 

tta tta tgatcaaaag ataegtctga taataataaa atgcgattgt atttaggctg 
Leu Leu 



tagattatta ttgggaattc 

<210> 84 
<211> 314 
<212> PRT 

<213> Lycopersicon esculentum 
<400> 84 

Met Ala Ala Gly lie Ser Ala Ser Ala Ser Ser Arg Thr lie Arg Leu 
15 10 15 



Arg His Asn Pro Phe Leu Ser Pro Lys Ser Ala Ser Thr Ala Pro Pro 
20 25 30 



Val Leu Phe Phe Ser Pro Leu Thr Arg Asn Phe Gly Ala lie Leu Leu 
35 40 45 



131 



Ser Arg Arg Lys Pro Arg Leu Ala Val Cys Phe Val Leu Glu Asn Glu 
50 55 60 



Lys Leu Asn Ser Thr lie Glu Ser Glu Ser Glu Val He Glu Asp Arg 
65 70 75 80 



He Gin Val Glu He Asn Glu Glu Lys Ser Leu Ala Ala Ser Trp Leu 
85 90 95 



Ala Glu Lys Leu Ala Arg Lys Lys Ser Glu Arg Phe Thr Tyr Leu Val 
100 105 110 



Ala Ala Val Met Ser Ser Leu Gly He Thr Ser Met Ala He Leu Ala 
115 120 125 



Val Tyr Tyr Arg Phe Ser Trp Gin Met Glu Gly Gly Glu Val Pro Phe 
130 135 140 



Ser Glu Met Leu Ala Thr Phe Thr Leu Ser Phe Gly Ala 'Ala Val Gly 
145 150 155 160 



Met Glu Tyr Trp Ala Arg Trp Ala His Arg Ala Leu Trp His Ala Ser 
165 170 175 



Leu Trp His Met His Glu Ser His His Arg Pro Arg Glu Gly Pro Phe 
180 185 190 



Glu Met Asn Asp Val Phe Ala He Thr Asn Ala Val Pro Ala He Gly 
195 200 205 



Leu Leu Ser Tyr Gly Phe Phe His Lys Gly He Val Pro Gly Leu Cys 
210 215 220 



Phe Gly Ala Gly Leu Gly He Thr Val Phe Gly Met Ala Tyr Met Phe 
225 230 235 240 



132 

Val His Asp Gly Leu Val His Lys Arg Phe Pro Val Gly Pro He Ala 
245 250 255 



5 Asn Val Pro Tyr Phe Arg Arg Val Ala Ala Ala His Gin Leu His His 
260 265 270 



Ser Asp Lys Phe Asp Gly Val Pro Tyr Gly Leu Phe Leu Gly Pro Lys 
10 275 280 285 



Glu Leu Glu Glu Val Gly Gly Leu Glu Glu Leu Glu Lys Glu Val Asn 
290 295 300 

15 

Arg Arg He Lys He Ser Lys Gly Leu Leu 
305 310 

20 

<210> 85 
<211> 34 
25 <212> DNA 

<213> Kunstliche Sequenz 

30 

<220> 

<221> Primer 
35 <222> (1)..(34) 
<223> 



40 

<400> 85 

ccatggaagc tcttctcaag ccttttccat ctct 



45 <210> 86 
<211> 34 



<212> DNA 

50 



<213> Kunstliche Sequenz 



<220> 

<221> Primer 
<222> (1) . . (34) 
<223> 

<400> 86 

ggatcctcaa aggctctcta ttgctagatt gcca 

<210> 87 

<211> 1505 

<212> DNA 

<213> Lycopersicon esculentum 
<220> 

<221> .CDS 

<222> (3) . . (1505) 

<223> 

<400> 87 

cc atg gaa get ctt etc aag cct ttt cca tct ctt tta ctt tec tct 

Met Glu Ala Leu Leu Lys Pro Phe Pro Ser Leu Leu Leu Ser Ser 
15 10 15 

cct aca ccc cat agg tct att ttc caa caa aat ccc tct ttt eta agt 
Pro Thr Pro His Arg Ser lie Phe Gin Gin Asn Pro Ser Phe Leu Ser 
20 25 30 



ccc ace acc aaa aaa aaa tea aga aaa tgt ctt ctt aga aac aaa agt 
Pro Thr Thr Lys Lys Lys Ser Arg Lys Cys Leu Leu Arg Asn Lys Ser 
■35 40 45 



PF 53863 



134 



agt aaa ctt ttt tgt age ttt ctt gat tta gca ccc aca tea aag cca 
Ser Lys Leu Phe Cys Ser Phe Leu Asp Leu Ala Pro Thr Ser Lys Pro 
50 55 60 

5 

gag tct tta gat gtt aac ate tea tgg gtt gat cct aat teg aat egg 
Glu Ser Leu Asp Val Asn lie Ser Trp Val Asp Pro Asn Ser Asn Arg 
65 70 75 

10 get caa ttc gac gtg ate att ate gga get ggc cot get ggg etc agg 
Ala Gin Phe Asp Val He He He Gly Ala Gly Pro Ala Gly Leu Arg 
80 85 90 95 

eta get gaa caa gtt tct aaa tat ggt att aag gta tgt tgt gtt gac 
15 Leu Ala Glu Gin Val Ser Lys Tyr Gly He Lys Val Cys Cys Val Asp 

100 105 I 10 

cct tea cca etc tec atg tgg cca aat aat tat ggt gtt tgg gtt gat 
Pro Ser Pro Leu Ser Met Trp Pro Asn Asn Tyr Gly Val Trp Val Asp 
20 H5 120 125 

gag ttt gag aat tta gga ctg gaa aat tgt tta gat cat aaa tgg cct 
Glu Phe Glu Asn Leu Gly Leu Glu Asn Cys Leu Asp His Lys Trp Pro 
130 135 140 

25 

atg act tgt gtg cat ata aat gat aac aaa act aag tat ttg gga aga 
Met Thr Cys Val His He Asn Asp Asn Lys Thr Lys Tyr 'Leu Gly Arg 
145 150 155 

30 cca tat ggt aga gtt agt aga aag aag ctg aag ttg aaa ttg ttg aat 
Pro Tyr Gly Arg Val Ser Arg Lys Lys Leu Lys Leu Lys Leu Leu Asn 
ISO 165 170 175 

agt tgt gtt gag aac aga gtg aag ttt tat aaa get aag gtt tgg aaa 
35 Ser Cys Val Glu Asn Arg Val Lys Phe Tyr Lys Ala Lys Val Trp Lys 

180 185 190 

gtg gaa cat gaa gaa ttt gag tct tea att gtt tgt gat gat ggt aag 
val Glu His Glu Glu Phe Glu Ser Ser He Val Cys Asp Asp Gly Lys 
40 195 200 205 

aag ata aga ggt agt ttg gtt gtg gat gca agt ggt ttt get agt gat 
Lys He Arg Gly Ser Leu Val Val Asp Ala Ser Gly Phe Ala Ser Asp 
210 . 215 220 

45 

ttt ata gag tat gac agg cca aga aac cat ggt tat caa att get cat 
Phe He Glu Tyr Asp Arg Pro Arg Asn His Gly Tyr Gin He Ala His 
225 230 235 

50 ggg gtt tta gta gaa gtt gat aat cat cca ttt gat ttg gat aaa atg 



191 



239 



287 



335 



383 



431 



479 



527 



575 



623 



671 



719 



767 



PF 53863 
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Gly Val Leu Val Glu Val Asp Asn His Pro Phe Asp Leu Asp Lys Met 
240 245 250 255 

gtg ctt atg gat tgg agg gat tct cat ttg ggt aat gag cca tat tta 
Val Leu Met Asp Trp Arg Asp Ser His Leu Gly Asn Glu Pro Tyr Leu 
260 265 270 

agg gtg aat aat get aaa gaa cca aca ttc ttg tat gca atg cca ttt 
Arg Val Asn Asn Ala Lys Glu Pro Thr Phe Leu Tyr Ala Met Pro Phe 
275 280 285 

gat aga gat ttg gtt ttc ttg gaa gag act tct ttg gtg agt cgt cct 
Asp Arg Asp Leu Val Phe Leu Glu Glu Thr Ser Leu Val Ser Arg Pro 
290 295 300 

gtt tta teg tat atg gaa gta aaa aga agg atg gtg gca aga tta agg 
Val Leu Ser Tyr Met Glu Val Lys Arg Arg Met Val Ala Arg Leu Arg 
305 310 315 

cat ttg ggg ate aaa gtg aaa agt gtt att gag gaa gag aaa tgt gtg 
His Leu Gly He Lys Val Lys Ser Val He Glu Glu Glu Lys Cys Val 
320 325 330 335 

ate cct atg gga gga cca ctt ccg egg att cct caa aat gtt atg get 
He Pro Met Gly Gly Pro Leu Pro Arg He Pro Gin Asn Val Met Ala 
340 345 350 

att ggt ggg aat tea ggg ata gtt cat cca tea aca ggg tac atg gtg 
He Gly Gly Asn Ser Gly He Val His Pro Ser Thr Gly Tyr Met Val 
355 360 365 

get agg age atg get tta gca cca gta eta get gaa gec ate gtc gag 
Ala Arg Ser Met Ala Leu Ala Pro Val Leu Ala Glu Ala He Val Glu 
370 375 380 

ggg ctt ggc tea aca aga atg ata aga ggg tct caa ctt tac cat aga 
Gly Leu Gly Ser Thr Arg Met He Arg Gly Ser Gin Leu Tyr His Arg 
385 390 395 

gtt tgg aat ggt ttg tgg cct ttg gat aga aga tgt gtt aga gaa tgt 
Val Trp Asn Gly Leu Trp Pro Leu Asp Arg Arg Cys Val Arg Glu Cys 
400 405 410 415 

tat tea ttt ggg atg gag aca ttg ttg aag ctt gat ttg aaa ggg act 
Tyr Ser Phe Gly Met Glu Thr Leu Leu Lys Leu Asp Leu Lys Gly Thr 
420 425 430 



agg aga ttg ttt gac get ttc ttt gat ctt gat cct aaa tac tgg caa 
Arg Arg Leu Phe Asp Ala Phe Phe Asp Leu Asp Pro Lys Tyr Trp Gin 
435 440 445 



PF 53863 



10 



136 

ggg ttc ctt tct tea aga ttg tct gte aaa gaa ctt ggt tta etc age 
Gly Phe Leu Ser Ser Arg Leu Ser Val Lys Glu Leu Oly Leu Leu Ser 
450 455 460 

ttg tgt ctt ttc gga cat ggc tea aae atg act agg ttg gat att gtt 
Leu cys Leu Phe Gly His Gly Ser Asn Met Thr Arg Leu Asp He Val 
465 470 475 

aca aaa tgt ect ctt cct ttg gtt aga ctg att ggc aat eta gca at a 
Thr Lys Cys Pro Leu Pro Leu Val Arg Leu He Gly Asn Leu Ala lie 
480 485 490 495 



gag age ctt tga gga tec 
15 Glu Ser Leu Gly Ser 

500 



20 



<210> 88 
<211> 498 



<212> PRT 
25 <213> Lycopersicon esculentum 



1391 



1439 



1487 



1505 



<400> 88 

30 

Met Glu Ala Leu Leu Lys Pro Phe Pro Ser Leu Leu Leu Ser Ser Pro 
1 5 10 15 

35 Thr Pro His Arg Ser He Phe Gin Gin Asn Pro Ser Phe Leu Ser Pro 
20 25 30 



Thr Thr Lys Lys Lys Ser Arg Lys Cys Leu Leu Arg Asn Lys Ser Ser 
40 35 



40 45 



Lys Leu Phe Cys Ser Phe Leu Asp Leu Ala Pro Thr Ser Lys Pro Glu 

45 



cc 60 
50 55 



Ser Leu Asp Val Asn He Ser Trp Val Asp Pro Asn Ser Asn Arg Ala 



65 



70 



75 



80 



50 
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Gin Phe Asp val He He He Gly Ala Gly Pro Ala Gly Leu Arg Leu 
85 90 95 



5 Ala Glu Gin Val Ser Lys Tyr Gly He Lys Val Cys Cys Val Asp Pro 
100 105 110 



Ser Pro Leu Ser Met Trp Pro Asn Asn Tyr Gly Val Trp val Asp Glu 
10 115 120 125 

Phe Glu Asn Leu Gly Leu Glu Asn Cys Leu Asp His Lys Trp Pro Met 
130 135 140 

15 

Thr Cys Val His He Asn Asp Asn Lys Thr Lys Tyr Leu Gly Arg Pro 
145 150 155 160 

20 

Tyr Gly Arg Val Ser Arg Lys Lys Leu Lys Leu Lys Leu Leu Asn Ser 
165 170 l" 75 



25 Cys Val Glu Asn Arg Val Lys Phe Tyr Lys Ala Lys Val Trp Lys Val 
180 185 190 



Glu His Glu Glu Phe Glu Ser Ser lie Val Cys Asp Asp Gly Lys Lys 
30 195 200 205 

lie Arg Gly Ser Leu val Val Asp Ala Ser Gly Phe Ala Ser Asp Phe 
210 215 220 

35 

He Glu Tyr Asp Arg Pro Arg Asn His Gly Tyr Gin He Ala His Gly 
225 ' 230 235 240 

40 

Val Leu Val Glu Val Asp Asn His Pro Phe Asp Leu Asp Lys Met Val 
245 250 255 



45 Leu Met Asp Trp Arg Asp Ser His Leu Gly Asn Glu Pro Tyr Leu Arg 
260 265 270 

val Asn Asn Ala Lys Glu Pro Thr Phe Leu Tyr Ala Met Pro Phe Asp 
50 275 280 285 
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Arg Asp Leu Val Phe Leu Glu Glu Thr Ser Leu Val Ser Arg Pro Val 
290 295 300 

5 

Leu Ser Tyr Met Glu Val Lys Arg Arg Met Val Ala Arg Leu Arg His 
305 310 315 320 

10 

Leu Gly He Lys Val Lys Ser Val He Glu Glu Glu Lys Cys Val He 
325 330 335 



15 Pro Met Gly Gly Pro Leu Pro Arg He Pro Gin Asn Val Met Ala He 
340 345 350 



Gly Gly Asn Ser Gly He Val His Pro Ser Thr Gly Tyr Met Val Ala 
20 355 360 365 



Arg Ser Met Ala Leu Ala Pro Val Leu Ala Glu Ala He Val Glu Gly 
370 375 380 

25 

Leu Gly Ser Thr Arg Met He Arg Gly Ser Gin Leu Tyr 'His Arg Val 
385 ~ 390 395 400 

30 

Trp Asn Gly Leu Trp Pro Leu Asp Arg Arg Cys Val Arg Glu Cys Tyr 
405 410 415 



35 Ser Phe Gly Met Glu Thr Leu Leu Lys Leu Asp Leu Lys Gly Thr Arg 
420 425 430 



Arg Leu Phe Asp Ala Phe Phe Asp Leu Asp Pro Lys Tyr Trp Gin Gly 
40 435 440 445 



Phe Leu Ser Ser Arg Leu Ser Val Lys Glu Leu Gly Leu Leu Ser Leu 
450 455 460 

45 

Cys Leu Phe Gly His Gly Ser Asn Met Thr Arg Leu Asp He Val Thr 
465 ' 470 475 480 



50 
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Lys Cys Pro Leu Pro Leu Val Arg Leu He Gly Asn Leu Ala He Glu 
485 490 495 

5 Ser Leu 



10 



<210> 89 

<211> 37 

<212> DNA 

15 <213> Kunstliche Sequenz 



20 



<220> 

<221> Primer 
<222> (1>..(37> 
25 <223> 



<400> 89 37 



30 gagctcgata tctttgccag tattacaaca gcttata 

<210> 90 
35 <211> 31 
<212> DNA 

<213> Kunstliche Sequenz 

40 

<220> 
45 <221> Primer 

<222> (1)..(31) 
<223> 

50 



PF 53863 
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10 



15 



20 



25 



<400> 90 

31 

cccgggttta ctgaaaaata acagtaaaac c 



<210> 91 

<211> 2096 

<212> DNA 

<213> Lycopersicon esculentum 
<220> 

<221> Promoter 



<222> (1)..(2096) 
<223> 



35 



<400> 91 

gagctcgata tetttgecag tattacaaca gcttatatgt tgagcaggta aaagcttcaa 
30 tgccctattc tttctacagt tatcaatgtt getegtctaa tatctggtgt tcttctcgaa 
atgtcaattg gettgeagea cattgtcctc taatatccat tcaagcttct tagatgatga 
aacatttgtc aaatttatta atttcatagt gttcagtctc aattctttag ctgtttcctc 
atagtaaagt tgtctaatat gaaatgaaaa tgttctgtgt gttgtactaa taccttttca 
tggttgtcta tagaaegteg atgaagagee aaacagaaac tattttgggc tgegatttet 
40 gataccattg tatctgaatg ctgggtggga gctcatcaga agctttacaa tgggtcacat 
atatggagee gagtatgagg aatgctggga atcagttgtg cttcgcgtgc taggactttt 
ccttcctggt atttctgccc acagcccagt tgattacgtg aactccgtca gacttggaaa 

45 

ggagagaagt acccaaatgt cgtcttttta gaaatacttt tgtcacaaaa tageggggtt 
tacagctaca gaagatcatg cagaaggegt ccagtttagt ttttgaaggt tgtttggagt . 
50 ttatttatct aaagtaaact taaatcagct ttttgtttat gagttcagtg aactatatgt 



60 
120 
180 
240 
300 
360 
420 
480 
540 
600 
660 
720 
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tcaaataaga cttccctttg tagaatatgt gttttttttt gttgttgagc actttgtgtg 780 



cattggataa acccccaacg tgtaatagct accatacaag agaagtaact cgcactgtcc 84 0 

5 

atgtcttatg tggctcgact cagaaagcat tcagggggat tgataaccac cctccaaacc 900 

aactgaacca ttgtgaataa ccacccttca aatcaaccga gtcctcgtga aggacaaata 960 

10 tgtggtttta tatacattaa attttgtttt tacatgcttc ctcttacttc tttagttttc 1020 

ttgaccatat cttctttttc ccttctgtaa ttgacatttt cttcaaacca tccagcaatg 1080 



tggaagcttg acgattttcc ttcagagtag aaattgaaaa gaatcaacta aaaaggatag 1140 

15 

tccttcgatt tgatttccgg cttaaaaata aactaataag aatgagagag cgaataatag 1200 



aatattttga aattttaaag atattcaact atgttaaatt gcgttataaa tttcttaaat 1260 
20 tagtagcacc taatagttta gttctcaaaa gtcaaaacta ctacataatg tgctcatttt 132 0 



tcacattaaa atgcctacat gatgtaaaag taaaactcgt agcattctac gtgttttact 1380 

caactcaaac atcctgttca ttttaataaa cgtacgatga gcttctctct ccaattttct 1440 
25 ' 

tttctttttt ttttttaaaa aaatattttt ttttatatca atccaaatgg gctccaattt 1500 

atcataaatt aggtagaaac ttagatatta aagaaagaaa agggtttatc tcgcaagtgt 1560 

30 ggctatggtg ggacgtgtca aattttggat tgtagccaaa catgagattt gatttaaagg 1620 

gaattggcca aatcaccgaa agcaggcatc ttcatcataa attagtttgt ttatttatac 168 0 

agaattatac gcttttacta gttatagcat tcggtatctt tttctgggta actgccaaac 1740 
35 ^ . 




caccacaaat ttcaagtttc catttaactc ttcaacttca acccaaccaa atttatttgc 1800 



ttaattgtgc agaaccactc cctatatctt ctaggtgctt tcattcgttc cgaggtaaga 1860 

40 aaagattttt gtttctttga atgctttatg ccactcgttt aacttctgag gtttgtggat 192 0 

cttttaggcg actttttttt tttttgtatg taaaatttgt ttcataaatg cttctcaaca 1980 

taaatcttga caaagagaag gaattttacc aagtatttag gttcagaaat ggataatttt 2040 

45 

cttactgtga aatatcctta tggcaggttt tactgttatt tttcagtaaa cccggg 2096 



<210> 92 

50 
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<211> 25 
<212> DNA 
5 <213> Kunstliche Sequenz 

<220> 

10 

<221> Primer 
<222> (1)..(25) 
15 <223> 

<400> 92 
20 taagcttttt gttgaagaga tttgg 

<210> 93 
25 <211> 24 

<212> DNA 

<213> Kunstliche Sequenz 

30 

<220> 
35 <221> Primer 

<222> (1)..(24) 
<223> 

40 

<400> 93 

gaattcctgc aatagaatgt tgag 

45 



25 



24 
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